问题管理(Problem Management)是ITIL的核心流程之一,事件被接收后事件管理流程对其进行处理,通过一些应急措施,或临时修复来处理事件,强调的是个快速,效率。问题管理流程的重点在于消除引起问题的根本原因,找出解决问题的方案,从根本上解决问题。
问题管理通过对基础设施和相关的可用信息,事件数据库,来确定引发事件的真正原因以及在服务提供中存在的故障或错误。通过调查,问题管理最终确定引起事件的原因,一旦确定引发事件的根本原因,同时提交一个可接受的应急措施,此时就可以把问题当作一个已知问题来处理。因此一旦找到解决问题的最终解决方案,问题管理会发起一个变更请求(RFC)来消除已知错误。再此之后问题还会继续监控这些已知错误。最后问题管理将记录所有的已知错误,相关的症状及解决方案。通过问题管理流程IT组织可以积累一个问题解决方案库。通过解决方案库工程师可以快速处理事件,提高效率,同时也为组织节省了成本,提高客户的满意度。
问题管理-关键术语
Problem-问题 –A condition identified from multiple incidents exhibiting common symptoms, or from a single significant incident, Indicative of a single error, for which the cause is unknown
Know Error-已知错误 –A condition identified by successful diagnosis of the root cause of a problem, when it is confirmed which CI is at fault
Workaround-变通方法、零时措施 –Method of avoiding an incident or problem, either form a temporary fix or from a technique that means that the customer is not reliant on a particular aspect of a service that is know to have a problem.
Root Cause-根本原因 –The Discovered original error at fault
问题管理流程

