云服务器故障应急预案

1、使用云备份服务为云服务器创建定时备份。当云服务器故障时,选择需要恢复的时间点所对应的备份副本,将其制作为整机镜像,然后使用该镜像申请新的云服务器,或者在已有云服务器基础上切换镜像。为云服务器制作系统盘镜像。当云服务器故障时,使用该系统盘镜像申请新的云服务器,或者在已有云服务器基础上切换镜像。为云服务器的系统盘创建

2、云服务器的系统盘定时做好快照,当服务器出现问题的时候,直接用备份的快照进行恢复。

3、如突发问题为操作系统引起

   首先由技术人员对突发问题进行分析,确定引起问题的具体原因,如操作系统已无法启动,则由技术人员将具体情况通报运维工程师,进行系统备份恢复,如操作系统可启动,则由技术小组根据实际情况进行妥善快速处理。

4、如突发问题为软件引起

首先由技术人员收集系统日志,对突发问题进行分析,确定引起问题的具体原因,通过讨论确定初步解决方案,并对突发问题进行初步解决,如仍无法解决,则由技术人员备份数据库后,重装云平台解决。

5、如突发问题为网络引起

技术人员先将问题反馈给数据中心运维人员,协调网络管理员进行初步检查后确定问题原因,并在最短时间内给予解决。在事件处理过程中,技术人员要随时将突发问题处理情况上报数据中心运维人员。

6、如突发问题为数据库引起

技术人员先将问题反馈给数据库管理员和服务器运维人员,确定问题。数据库软件本身问题,可切换至实时备份数据库。也可以采用新建立数据库,恢复备份的数据库文件,如果原云服务器都无法恢复,可以采用其他云服务器进行恢复。

7、特殊情况处理

准备好阿里云平台的帐号、域名备案、服务器,如遇目前云平台UCLOUD 都无法使用的特殊情况,全部迁移至阿里云平台。