当用户的日常IT服务发生异常时,事件管理将被启用。例如,当用户在运行某应用程序时报错;又如,用户不能访问某新的网页。
准确的记录和跟踪事件非常重要,原因如下:
1. 当事件再次发生时,为IT服务人员提供参考,快速处理。
2. 每个事件都有其负责人,为IT服务团队评估工作量提供依据,方便资源调配。
3. 发现事件经常发生的区域,配备更多的资源,减少事件发生频率。
4. 为问题管理提供完整的信息。
5. 当启用服务等级协议(SLA)时,跟踪事件响应和解决的时间是否符合SLA。
新建事件
提交一个事件请求的初始状态,ServiceWise的每一个用户都拥有此权限。
可进行的操作:
1. 提交
2. 提交后在事件管理项目中产生一个新的记录。用户不能为提交的事件制定具体的负责人,以避免用户无意中将事件分配给一个暂不能提供服务的IT人员。
一线支持
对于每一个已提交的事件,都将来到这一状态。事件将被提交给IT服务团队的一个组,该组的所有成员都有权限处理,或者通过预定义的规则将事件自动分配到组中的某一个成员。其中,可以定义将各类事件自动分配给擅长于该类事件的服务人员。
组文件夹将是事件的第一个负责人,组中的某个成员负责所有未分配的事件,他可以选择自己处理该事件,或将事件分配给一个更适合的团队成员。
任何一个提交的事件,应完整填写以下信息:
在开启SLA模块的情况下,SLA模板会根据事件的完整分类自动应用。这并不限制团队成员认为自己能给帮助解决事件时,将事件分配给自己。
可进行的操作:
1. 升级二线
当出现以下情况时,可进行‘升级二线’的操作:
2. 请求变更
当需要通过变更配置项才能解决事件时采取此操作。在进行此操作时应将事件推进到‘等待 变更’状态,并提交变更请求记录与事件记录相关联。
将进行变更的配置项的更多信息,请参考本文档中变更管理流程部分。
3. 解决-通知用户
IT服务团队不管是使用以前的知识文档还是重新的研究恢复服务后,进行此操作。在此之前,IT服务人员应当与客户确认已经解决了事件。
4. 解决-关闭
二线支持
处于此状态的事件已经进行了初步的调研和尝试却没有成功,没有相关的知识文档能解决此事件或者使用其他知识文档的尝试都失败了。此状态的事件应具有更高的优先级,因为之前的处理已经经历了一段时间尽管服务没有恢复。
通常升级到‘二线支持’阶段的事件会分配给相关领域的其他专家。
可进行的操作:
1. 请求变更
当二线人员确认只有通过变更配置项才能解决事件时进行此操作。
当事件被推进到‘等待变更’阶段时,变更管理流程将自动创建一条新的变更记录,并与此事件管理。
2. 报告问题
当二线人员不能在合理的时间内提供解决方案时进行此操作。合理的时间示例如,提交事件后的48小时-1周,这可根据事件的分类、优先级和SLA的规定有所不同。
当事件被推进到‘调查研究’阶段时进行报告问题的操作,并自动提交问题与此事件关联。如果事件与现存的问题记录(或已知错误)相关,事件可以与问题做链接,当问题被解决或者有临时的解决方案时可以恢复事件相关的服务。
3. 解决-通知用户:当IT服务团队恢复服务后进行此操作,不管是使用以前的知识文档还是重新的研究。在此之前,IT服务人员应当与客户确认已经解决了事件。如果在调研和尝试解决的过程中产生了新的知识文档或‘How-To’信息时,可发布至知识库。
4. 解决-关闭:为了将有误的事件从事件列表中去处,可进行此操作。只有系统管理员或服务管理者可进行才操作。
等待变更
处于此状态的事件在等待变更的完成从而解决事件。
通常,处于此状态的事件都有相关联的变更请求记录,一旦变更请求完成后,事件会自动进行到下一个状态。在决定变更状态时,用户需要参考关联的事件信息。
可进行的操作:
1. 执行变更:在“变更管理”工作流程中,当一个关联的变更请求被推进到“变更完成”状态时,事件会自动进行此操作。通常,该操作由ServiceWise的‘跨项目自动化’功能自动进行。
2. 拒绝变更:变更管理流程拒绝变更请求时,关联的事件自动进行拒绝变更操作,退回至“二线支持”状态继续研究,同时变更管理流程的任何意见、备注、文档都对二线工程师开放,以帮助解决事件。
调研状态
对于没有找到解决方案以及由复发问题导致的事件会被置于该状态。该事件会与问题管理项目中的一个问题建立相关关系,一旦问题解决,或者是找到了应急,这个事件都会被自动转移至“已解决-通知用户”状态,同时负责该事件的技术人员也会收到通知。
可进行的操作:
已解决-通知用户:当相关问题找到了解决方案或者应急方案时该动作将自动进行。
变更完成
处于该状态下的事件已经执行完必须的变更了,现在需要负责该事件的技术人员给予关注。这意味着需要与事件的提交者取得联系,请他验证该事件是否被成功解决了还是需要更多的额外检修工作来完成该任务。
可进行的操作:
已解决-通知用户:当技术人员能够通过已知的步骤或者是调研和检修的结果向顾客恢复服务时,这个动作就会被执行。当然,在执行该动作前技术人员应该先同顾客确认该问题是否被彻底解决。
已解决-通知用户
处于该状态的事件表明了如下两者之一:
1、 IT服务已经完全恢复;
2、 导致该事件的潜在问题已经被彻底解决或者找到了变通的解决方法;
在第一种情况下,事件的负责人应该联系客户确认最初的问题已经被彻底解决。
在第二种情况下,当找到变通的解决方法后,技术团队需要更进一步的工作来实现这个变通的方案。技术团队应该与客户确认生成报告来确保服务已经恢复。
当技术人员确认服务已经完成恢复后,应该在事件的工作日志中进行记录已表明工作完成。
可进行的操作:
已解决-关闭:这步操作会关闭事件,同时将事件的所有信息变成只读状态。只有技术总监和ServiceWise系统管理员可以执行该操作,技术总监和系统管理员应该在关闭事件前确保所有工作已经完成。
已解决-关闭
任何事件处于该状态时,除技术监察员和系统管理员外,其他人看到的信息都是只读的。这样的目的是保证事件在关闭前已经由技术监察员复核过了,而技术监察员要求所有的工作必须完成。
可进行的操作:
重新打开事件:当发现一个事件并没有被彻底解决或者是在被认为解决后又重新发生时就会遇到该操作,该动作的执行者只能是技术监察员或者ServiceWise的系统管理员。
关于ServiceWise
ServiceWise 是TechExcel(泰克赛尔公司)推出的一款功能全面、可灵活定制的服务管理软件!尤其在IT服务管理(ITSM)领域拥有超过12年的发展历史,成功为Frist American、IKEA、华新水泥、大全集团等国内外知名客户建立起稳固高效的IT服务管理体系,全球43个国家和地区,1000多家客户中得到最佳实践。了解更多:http://www.techexcel.com.cn
【作者:张蕾】