ITIL 中国:浏览精彩论坛

中国信达资产管理公司IT服务管理案例(二)

发布: 2009-5-22 15:51 | 作者: webmast | 来源: 硅谷动力 | 查看: 0次

TAG: 管理 资产 服务 中国

字号: | 推荐给好友 上一篇 | 下一篇

解决方案 

  南天公司根据以上需求为信达定制了以下运行维护服务的解决方案。方案以信达总公司服务台为依托,将服务台建立为信达服务的监控平台、信息采集平台、任务发起平台和用户接口平台。在服务台的基础上建立事件管理、问题管理、配置管理和变更管理等工作流程。 

  下面分别介绍。 

  服务台:在信达总公司机房现场设立服务台,完成以下任务。 

  ·接收服务请求和咨询:在5*8小时工作时间内设置由专人职守的热线电话2部,分别接听总公司内部的服务请求和各办事处管理员的咨询和请求;在非工作时间设置有专人7*24小时接听的移动电话热线,用于解决总公司、办事处加班工作人员的技术问题以及接听7*24小时机房监控人员的机房情况汇报和请示。同时还通过E-mail/BBS/Msn等多种方式与用户,包括与办事处管理员进行密切联系和沟通,及时了解各地系统的运行状况。 

  ·系统运行状况监控:在总公司机房设立7*24小时不间断的监控岗位,主要通过一些系统管理工具进行诸如网络运行状况、系统服务状况的监控,同时监控机房的温度、湿度、供电等环境状况以及相应设备的运行状况。在5*8小时的工作时间内还会针对一些重要的应用服务进行进一步的检查,例如:每天定时进行关于业务系统、邮件系统重要功能的检查,并对检查结果进行详细记录。

  ·日常问题的处理:服务台的一项重要的工作是承担对总公司300个客户端的技术支持,通过电话或现场解决客户端问题。 

  ·发起管理过程:服务台通过对系统的监控和用户请求,初步判断系统中是否已经有紧急事件发生,或者有问题需要解决,由此发起相应管理过程,例如:系统紧急恢复或者进入问题跟踪处理流程、进行配置的更改等等。 

  ·执行应对紧急情况的处理操作:根据事件管理过程和问题管理过程预先定义的紧急情况假设和相应的应对办法,当有紧急情况发生时,如果符合预先定制的紧急情况特征,则在最短的时间内启动应急处理操作,并确认应急操作是否达到预期的效果。日常情况下,需要定期在测试环境中演练紧急操作步骤,并根据系统配置变更调整应急操作的过程。 

  ·执行对系统问题的一线解决:负责服务台的工程师有责任进行现场的问题处理,在应急措施到位的前提下,服务台的工程师还要进行诸如联系相应的供应商,申请相关服务的工作。对于要解决的问题除进行记录以外,要对问题进行首次解决,并判断发生问题的单元。如果在规定的时间内不能解决,则根据流程调用二线、三线的技术支持。 

  ·统计服务情况,与用户定期进行沟通:项目组月度与用户进行交流,汇报本月系统运行状况,和对问题的跟踪解决情况。并接受用户方对项目组的要求和下一阶段需要配合得的重要工作。

  事件管理过程:
南天和信达在针对信达各系统定制事件管理过程时,详细分析了信达公司业务的特点,将5*8小时工作时间里的系统可用性放在了首要的地位,事件管理的重点是应对工作时间内系统可能发生的紧急情况。结合信达现有的技术条件,项目组尽可能的使用冗余设备,为系统服务建立在线热备、冷备机制。例如强化重要系统(业务系统、数据库、邮件系统等)双机热备的可用性,定期进行双机的切换演练,并通过一些措施加快双机切换的速度。 

  ·对于一些没有实现双机的服务也可以进行建立备份机的冷备策略,本着设备充分利用的原则,将一台备用设备同时冷备2~3台生产设备,通过不同的应急操作可以在最短的时间内将备用设备模拟成生产设备,并对用户透明。 

  ·对于不能实现在线备份的系统则进行系统恢复的预想和演练。例如数据通过磁带恢复工作,预先编写的应急恢复操作手册将操作步骤尽可能简化,以降低操作者的操作难度和技术要求。大量采用脚本编写的方式使许多工作自动完成。也采用一些第三方工具使例如NT系统的恢复自动完成。

  问题管理过程: 

  ·信达服务内容涉及主机、磁盘阵列、服务器、磁带备份设备、三层交换机路由器、交换机、卫星接收设备、同步传输设备、高速行打印设备等多种硬件;同时包括Unix、Netware、Windows、Oracle、Informix、Weblogic、Exchange等多种大型的应用软件系统。所以服务于信达就需要以上各个方面的专业技术人员。针对这种情况,在问题管理的流程中为问题的解决定义了相对更加复杂的支持级别。 

  ·服务台人员作为第一级问题处理人员,需要对上述每一种系统有比较详尽的了解,同时了解上述系统相应业务系统中所处的地位,在解决问题过程中既能够判断问题原因,又能够为二、三线的技术专家进行有力的配合。 

  ·二线的技术专家指南天公司的相关技术人员,他们通过巡检、远程连接的方式检查相应系统。在一线问题解决不能完成的情况下,二线技术专家将迅速开始问题解决过程,必要时将会到达现场解决。二线专家在一定领域内拥有丰富的经验和技术积累,在与一线人员的配合工作中发挥各自优势,以利于问题解决。 

  ·三线技术专家指南天以外的例如厂家的技术专家,南天公司通过合同的方式与重要的产品供应商或线路服务商建立战略合作关系,在相应产品或系统故障发生时通过三线专家的介入,使问题解决时间能够大大缩短。 

  ·一线、二线、三线专家都将为问题彻底解决或找到有效的解决方法负责,防止同样问题不再重复发生。 

  变更管理和配置管理: 

  建立配置库控制变更管理、配置管理。 

  为规范信达各个系统的配置和配置的变更,南天公司在信达建立了专门定制的配置管理库,除了将所有系统的配置参数、更改历史记录在数据库中,同时将服务过程中的所有内容记录在案。配置库中对于人员角色的定义和权力的分配有严格的定制,对配置的更改和对问题的跟踪处理都有详尽的时间记录和操作员记录。配置数据库为实现变更管理和配置管理提供可能。 

  其他模块: 

  目前,IT系统管理的其他一些模块在信达暂时还没有使用,或没有将这部分内容进行流程化定义,是因为这些模块的内容在信达服务中发生的次数较少(例如容量管理),而且许多外界因素导致一些模块需要更长的时间才能有详细的定制(例如财务管理)。 

  对于SLA的管理,南天和信达形成一个共识,认为现阶段暂时不需要对SLA进行过分的苛求,因为SLA涉及到设备、软件、线路、服务、客户端等多个方面,过高和过低的SLA要求都是对信达IT系统管理不负责任的表现,而要严格计算出针对于信达系统的SLA并将其付诸实施需要大量的积累和工作量投入,势必带来大量的成本投入,所以这个过程现在并没有出现在服务中。但是系统每年的服务中断时间和次数都有严格的记录和统计,以务实的态度处理好每一次是事件的发生和问题的解决。
 

评分:0

我来说两句