IT运维日常问题处理原则

倖福魔咒の 提交于 2020-02-03 15:42:18

摘自日常工作中的一封邮件内容

处理日常问题的一些原则:

1、 对于用户反馈的问题,我们首先要做到的时候及时响应和反馈,重点不是说要立即解决问题,用户的满意度更多取决于我们是否对他给予了足够的关注,而不是问题是否解决。所以一定要在第一时间响应,包括告知他我们现在是不是有空来处理这个问题,以及什么时候可以处理等。对于短期处理不了的问题,要给予信服的解释以及可能的完成时间,还要帮助用户想其他的解决方案,包括非IT技术手段的方案,我们要主动在内部升级解决不了的问题,而不是让用户去升级问题。

2、 不管在任何时候,搞清楚问题的原因都比解决问题更重要,因为我们的最终目的是给用户提供更可靠稳定的IT服务,而不是做一个救火队员。如果没有搞清楚问题根源,那么即使当时解决了也可能治标不治本,还会反复发生,既影响用户体验也增加我们的工作量。所以我们一定要转变观念,在给用户及时反馈沟通的前提下,把优先度放到查找问题根源,而不是解决问题。

3、 有时候,可能没有足够的时间去查找问题根源,比如用户急着用,或者我们现在确实没空,或者问题复杂度太高很难查出根源。这时候需要我们做出判断,看应该是优先解决问题还是优先分析问题根源,可以从以下几个点出发去判断:

问题是否紧急,主要是看是否会立即影响到用户的工作正常进行。此时可考虑提供替代方案而保留故障源,因为一旦处理掉故障源,不利于后续排查问题根源。当然用户性质也要作为考虑因素,老大们通常时间比较紧张,也很难配合我们去分析问题,所以对于这类用户,通常以优先解决问题为主。

问题是否已重复发生,通常对于比较特异并初次发生的问题,可以不用去深究根源,可以先直接采用重启、重装、重置等方式更快速的处理。

问题是否可以模拟重现,如果问题不可以模拟重现,说明根因比较复杂,可以记录后保持观察,但是一定要对问题发生的具体细节进行记录,比如具体的发生时间,系统环境和用户操作的细节,故障现象特点,才能有助于后续总结分析。

问题是否涉及到系统调整/升级,如果涉及到系统调整/升级,一定要尽可能保留故障现象,而不是直接快速处理,因为系统调整/升级带来的问题,很可能会在后续变得更严重,一定要在出现苗头时就尽可能分析清楚,并提前解决。

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!