XXX容灾方案
图表目录
1 简介
1.1 容灾方案设计原则
容灾设计所考虑的主要原则作简要描述。可以参考以下内容:
1) 以高层访谈结果作为灾备策略选择的指导原则;
2) 以业务影响分析作为灾备策略选择的重要依据;
3) 以应用影响分析整理灾备方案的需求;
4) 以“由分至合”的方式来设计灾难备份的整体方案。
同时,我们也将遵循以下通用的IT架构设计原则:
1) 开放性原则:系统符合开放性设计原则,具备优良的可扩展性、可升级性和灵活性,对现有技术具有普适能力,可以广泛支持开放系统平台,运行于现有或即将成为标准的各种相关技术标准上。
2) 兼容性原则:与现有系统需要完全兼容,各个构成子系统必须紧密衔接,高度集成,构成有机的整体,同时大大降低系统维护的复杂性。
3) 安全性原则:确保应用系统的安全运行和故障恢复机制。
4) 稳定性原则:要保证系统的稳定性和可行性,使系统的运行风险降至最低。
5) 可管理性原则:可以对系统进行集中管理和监控。
6) 保护原有投资原则:本地备份与同城灾备系统建设必须充分利用原有的资源,如中心机房升级后置换下来的服务器,从而避免重复原有投资。
7) 经济性原则:在满足所有需求的前提下,选择最合适的设备及管理软件,使系统具有较好的性能价格比。
1.2 考虑的灾难情形
描述该容灾方案所应对的主要灾难情形,这将影响后续的容灾方案的选择。如不考虑区域性灾难,如区域地震等,将可以采用同城灾备的方式。如果考虑区域灾难,则只能选用异城灾备。可以参考以下内容:
本容灾方案所考虑考虑的灾难场景包括:
1) 机房内灾难 ;
2) 办公区域大楼灾难 ;
3) 区域性灾难不在本次项目范围之内。
2 容灾整体架构设计
对容灾所采用的总体架构作具体描述,可以从下面所描述的6个级别中选择一个级别作为容灾整体架构设计的参考,并对所选择的级别所需要的要素作设计性简述。
容灾所需的恢复能力需求按照RTO/RPO可以分为6个极别,如下表。
灾难恢复能力等级 | RTO | RPO |
1 | 2天以上 | 1天至7天 |
2 | 24小时以上 | 1天至7天 |
3 | 12小时以上 | 数小时至1天 |
4 | 数小时至2天 | 数小时至1天 |
5 | 数分钟至2天 | 0-30分钟 |
6 | 数分钟 | 0 |
容灾一个6个级别都需考虑的7个要素如下:
1) 数据备份系统:
一般由数据备份的硬件、软件和备份介质,如果是通过电子传输的数据备份系统,还包括数据备份线路和相应的通信设备。
2) 备用数据处理系统:
指备用的计算机、外围设备和软件。
3) 备用网络系统:
最终用户用来访问备用数据处理系统的网络,包括备用网络通信设备和备用数据通信线路。
4) 备用基础设施:
灾难恢复所需的、支持灾难备份系统运行的建筑、设备,包括存储介质的远程存放场所、备用的机房、灾难恢复工作辅助设备,以及允许灾难恢复人员连续停留的生活设施。
5) 专业技术能力:
对灾难恢复系统的运转提供支撑和保障的能力,以实现灾难恢复系统的预期目标。包括硬件、系统软件和应用软件的问题分析和处理能力、网络系统安全运行管理能力、沟通协调能力等。
6) 运行维护管理能力:
包括运行环境管理、系统管理、安全管理和变更管理。
7) 灾难恢复预案。
3 容灾资源要素需求分析
在本节对上述6个资源要素按照整体架构设计和灾难恢复要求,确定其相应的需求。
3.1 数据备份系统
根据灾难恢复目标,按照成本风险平衡的原则,确定:
– 备份的范围
– 备份的时间间隔
– 数据备份的技术及备份介质
– 数据备份线路的速率及相关通信设备的规格和要求
3.2 备份数据处理系统
应根据关键业务的灾难恢复对备用数据处理系统的要求和未来的发展需要,按照成本风险平衡原则,确定备用数据处理系统的:
– 数据处理能力
– 与主系统的兼容性要求
– 平时处于就绪状态还是运行状态
3.3 备用网络系统
应根据关键业务的灾难恢复对网络容量及却换时间的要求和未来的发展需要,按照成本风险平衡原则,选用备用数据通讯信的技术和线路带宽,确定网络通信设备的功能和容量,保证灾难恢复时,最终用户能以一定的速率连接到备用数据处理系统。
3.4 备用基础设施
应根据灾难恢复目标,按照成本风险平衡原则,确定对备用基础设施的要求,包括:
– 与主中心的距离要求
– 场地和环境要求(如面积、温度、湿度、防火、电力、开放时间等)要求
– 运行维护和管理要求
3.5 专业技术能力
应根据灾难恢复目标,按照成本风险平衡原则,确定灾备中心在软件、硬件、网络等方面的技术要求,包括技术支持的组织架构、各类技术支持人员的素质和数量等要求。
3.6 运行维护管理能力
应根据灾难恢复目标,按照成本风险平衡原则,确定运行维护管理要求,包括维护管理组织架构、人员的数量和素质、运行维护管理制度等要求。
3.7 灾难恢复预案
应根据分析的结果,按照成本风险平衡原则,明确灾难恢复预案的:
– 整体要求
– 制定过程的要求
– 教育、培训和演练的要求
– 管理要求
4 实现容灾资源要素需求的建议方案
在本节对上述6个资源要素的实现方式和方案提供建议。
4.1 容灾系统技术方案
根据灾难恢复目标和容灾资源要素需求分析的结果,制定容灾系统的技术方案,包括数据备份系统、备用数据处理系统和备用网络系统。所设计的方案应该考虑到:
– 与主系统相同的安全保护措施
– 具有适当的可扩展性
– 对主系统可用性和性能的影响
其中技术方案所需的技术设施等硬件资源可以采用以下方式获得:
– 事先与厂商签订紧急供货协议
– 事先购买所需的设备,并存放(或安装在)灾备中心或存放在安全的仓库中
– 利用商业灾备中心或其他机构已有的兼容设备
4.2 备用基础设施选择方案
根据灾难恢复目标和容灾资源要素需求分析的结果,选择灾备中心的场所。应该避免灾难中心与主中心同时遭受同类风险。灾备中心应具备数据备份和灾难恢复所需的通信、电力等资源,以及方面灾难恢复人员和设备到达的交通条件。
灾备中心可供选择的方案包括:
– 租用商业灾备中心
– 自建灾备中心
– 共建或借用其他组织的场所
4.3 运行能力建议方案
运行能力建议方案包括专业技术能力的获取或维护方式,建立必要的灾备中心运维管理制度和灾难恢复预案,以保准容灾方案的处于可用的方案。必要还应提出灾备系统建立时(前),所需的测试方式。
发表评论