机房应急预案
随着XXX信息化建立的不断深入,加强机房各类设备、系统以及信息与网络平安等方面应对突发事件的处理能力将是信息部门目前面临的一项重要任务。
为应对机房可能发生的突发事件,将正在发生或已发生事故的损害程度减轻到最低,确保员工平安,特制定本应急处置预案。
1.1 机房突发事件分类
1.自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。 2.事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。
3.人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐惧袭击等引起的网络与信息系统的损坏。
1.2 应急处理人员组织机构
- . 可修编.
- .
1.3 应急机构人员岗位职责
1、应急总指挥职责
〔1〕保证在任何时间,及时协调应急行动所有涉及的岗位人员; 〔2〕提供必须的紧急响应设备; 〔3〕在紧急情况下全面负责紧急行动;
〔4〕在必要时向外界求救,例如:119、110、120等。 2、应急副总指挥职责
〔1〕在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责; 〔2〕根据获得的应急信息下达命令。 3、各相关设备负责人职责
〔1〕负责尽快收集信息向应急总指挥汇报事故情况; 〔2〕负责现场临时设备抢救和对事态的控制; 〔3〕听从上级指挥人员的指挥。
1.4 信息与网络平安突发事件处理原那么
1.预防为主。立足平安防护,加强预警,重点保护根底信息网络和关系信息平安、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑信息与网络平安保障体系。
2.快速反响。突发事件发生时,按照快速反响机制,及时获取充分而准确的
- . 可修编.
- .
信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响。
3.分级负责。按照“谁主管,谁负责〞的原那么,建立和完善平安责任制及联开工作机制。根据各负责人的职能,各司其职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。
4.以人为本。把保障人员以及公共利益的平安作为首要任务。
5.常备不懈。加强技术储藏,规应急处置措施与操作流程,定期进展预案演练,确保应急预案切实有效,实现网络与信息平安突发公共事件应急处置的科学化、程序化与规化。
1.5 机房应急开关机具体措施
机房各设备关闭顺序如下:
1.6 效劳器及存储设备故障处理
1.6.1 排错流程
- . 可修编.
- .
1.6.2应急处置具体措施 效劳器设备损坏应急处置措施
A、关键应用系统所在效劳器设备损坏后,应立即查明原因,使用备份效劳器替换损坏设备,并立即恢复应用系统正常使用; B、立即与设备提供商联系,请求派维修人员前来维修。 效劳器软件损坏紧急处置措施
A、迅速查找原因,尝试重启系统。使用备份进展恢复。必要时联系开发商;
- . 可修编.
- .
B、当发现效劳器感染有病毒后,应立即将该机从网络上隔离出来。并启用杀病毒软件对该机进展杀毒处理,同时使用病毒检测软件对其他机器进展病毒扫描和去除工作。经技术人员确认确实无法查杀该病毒后,应作好相关记录,并迅速联系有关产品商研究解决;
C、当因空调,电力等问题需要关闭所有效劳器时,应遵循如下步骤: 先关闭所有应用效劳器和数据库效劳器,再关闭存储设备。启动所有效劳器时,应先翻开存储设备,再翻开数据库效劳器,最后翻开应用效劳器。
1.6.3 效劳器突发情况记录文档
日期 故障发生时间 效劳器名称 IP 现象 处理情况 故障恢复时间 处理工程师 备注
1.7 网络设备故障处理
1.7.1 网络设备排错流程
网络设备的排错流程
下面流程图是网络维护人员所应采取的排错模型,当发生网络故障时应按照此流程快速进展定位、排除故障。
- . 可修编.
- .
1.7.2 网络系统故障突发事件分级
故障等级 1级 网络完全拥塞或设备宕机 网络或设备处理能力严重受影响,对最终客户的业务运作有严重影响 网络或设备故障对重要的客户〔公司经理级或重要的部门〕造成严重影响 2级 网络或设备的性能严重下降,对最终客户的业务运作产生重要影响 局部区域网络故障 故 障 现 象 - . 可修编.
- .
一般网络节点发生故障 大局部客户的网络通讯质量下降 3级 4级
1.7.3 应急措施
黑客攻击时的紧急处置措施
A、当发现网页容被篡改、Internet接入路由器有未知用户登录或通过其他方式发现有黑客正在进展攻击时,应立即向信息部相关人员通报情况;
B、在信息部人员授权下,立即备份当时的log日志并采用端口限制方式阻断外部的入侵,观察被攻击的效劳器等设备状态,同时向信息部领导汇报情况;
C、协调相关应用部门,与信息部有关技术人员一同负责被破坏系统的恢复与重建工作;
D、协助信息部人员协同有关部门共同追查非法信息来源; E、情况严重的,根据突发事件级别应及时向有关上级部门汇报。 病毒平安紧急处置措施
A、当发现计算机感染有病毒后,应立即将该机从网络上隔离出来;或从网络设备状态发现病毒爆发应采取show mac-address sh arp定位或IP查询将病毒机
- . 可修编.
网络或设备性能受损,但最终客户大局部业务仍可正常工作 报警出错和操作命令反常 其它一般的故障,不影响系统的整体运行,不影响大局部客户的使用 - .
器所在的网络设备端口shutdown;
B、通知维护人员对该设备的硬盘进展数据备份;
C、启用杀病毒软件对该机进展杀毒处理,同时进展病毒检测软件对其他机器进展病毒扫描和去除工作;
D、如发现杀病毒软件无法去除该病毒,应立即通知用户并向及信息部负责人报告,经信息部技术人员确认无法查杀该病毒并同意格式化硬盘后,作好相关记录,并格式化硬盘;
E、机器恢复后重新开启网络设备的相应端口;
F、认为情况极为严重,根据突发事件级别应及时向有关上级部门汇报。 广域网线路中断紧急处置措施
A、链路出现问题后,网络维护人员应立即信息部负责人报告,沟通地方节点技术人员共同迅速判断故障,查明故障原因;
B、如属我方管辖围,由双方技术人员立即配合予以恢复。如遇无法恢复情况,立即进展备件更换或向有关厂商请求支援;
C、如属运营商管辖围,立即与运营商维护部门申报故障,请求修复; D、根据突发事件级别应及时向有关上级部门汇报。 局域网中断紧急处置措施
A、局域网中断后,网络维护人员应立即判断故障节点,查明故障原因,并向信息部领导汇报;
- . 可修编.
- .
B、如属线路故障,更换新线路或重新安装线路;或从最近飞线至故障设备; C、如属路由器、交换机等网络设备〔光模块〕故障,应立即查找是否有相关备件可以替换,或与设备提供商联系更换设备,并调试畅通;
D、如属路由器、交换机配置文件破坏,应迅速按照备份配置文件重新配置,并调试畅通;如遇无法解决的技术问题,立即向有关厂商请求支援;
E、情况严重的,根据突发事件级别应及时向有关上级部门汇报。
1.7.4 网络突发事件记录文档
日期 故障发生时间 线路 设备IP 端口 现象 处理情况 故障恢复时间 处理工程师 备注
1.8 空调设备故障处理
假设空调损坏,应第一时间通知厂家上门进展维修,并及时报告信息部相关领导请示,获得授权后按机房设备关闭顺序关闭各类设备。
1.9 消防设备故障处理
一旦机房发生火灾,应遵照以下原那么:首先确保人员平安;其次保护关键设备、数据平安;三是保护一般设备平安;
人员疏散的程序是:机房工作人员立即按响火警警报,并通过119向公安消防请求支援,所有人员戴上防毒面具,所有不参与灭火的人员按照预先确定的线
- . 可修编.
- .
路,迅速从机房中撤出;
人员灭火的程序是:首先切断所有电源,启动自动喷淋系统或使用灭火器,灭火值班人员戴好防毒面具,从指定位置取出泡沫灭火器进展灭火。
1.10 电源设备故障处理
热力机房目前使用UPS系统,在紧急情况发生时,应按如下步骤进展关机: 〔1〕确认所有负载均已平安关机。 〔2〕关闭UPS负载电源。
〔3〕将UPS的系统启用开关切换到off 的状态。 〔4〕将DC电池连接断路器切换到off的位置。 〔5〕将所有电池拉出到红色电池断开线以外。 〔6〕断开PDU上的断路器。
〔7〕将PDU后面总输入断路器切换到断开位置。 〔8〕将每个上行主电路断路器切换到断开位置。
1.11 维护小组成员
1.11.1 现场效劳人员联系方式
职务 XX 手机 - . 可修编.
- . 1.11.2 厂家协助效劳人员联系方式
XX 公司 职责 网络设备代理商 效劳器及小型机等设备代理商 机房弱电相关事项 机房强电相关事项 机房空调 UPS设备 发电机设备 物业工程部 消防设施
- . 可修编.
因篇幅问题不能全部显示,请点此查看更多更全内容