您现在的位置是:首页 > IT基础架构 > 计算存储 >

信息系统灾难备份技术简述

2012-09-20 09:38:08作者:来源:

摘要一般来讲,灾备系统可以分为数据级容灾、应用级容灾和业务级容灾。数据容灾是基础和前提,只有保证数据能及时、完整地备份或复制到灾备中心,才能在灾难发生时及时恢复受灾业务。...

  1 背景

  党中央和国务院十分重视信息安全工作。2003年,中办发[2003127号文《国家信息化领导小组关于加强信息安全保障工作的意见》,要求各基础信息网络和重要信息系统建设要充分考虑抗毁性与灾难恢复,制定和不断完善信息安全应急处置预案。2004年,国家网络与信息安全协调小组办公室发 12004]11号文《关于做好重要信息系统灾难备份工作的通知》。明确指出,提高抵御灾难和重大事故的能力,减少灾难打击和重大事故造成的损失、确保重要信息系统的数据安全和作业连续性,避免引起社会重要服务功能的严重中断,保障社会经济的稳定。2005年,国务院信息化工作办公室出台了《重要信息系统灾难恢复规划指南》,为灾难恢复工作提供了一个操作性较强的参考思路。

  2007年,国家标准《信息系统灾难恢复规范》(GB/T20988-2007)正式颁布,这是灾备建设中具有里程碑意义的重要大事。该标准对灾难备份、灾难恢复相关术语进行了规范和梳理,指明了灾难恢复工作的流程,明确了灾难恢复的等级和相关要素,制订了灾难恢复工作的主要环节及各环节具体工作等。在2010年召开的第五届中国灾难恢复行业高层论坛上,提出了我国将全面启动灾难恢复体系建设,制定强制性灾备建设规范,完善灾备标准体系并及时出台灾难恢复服务资质管理办法,以促进政府相关部门、行业用户、企业灾难恢复保障体系的发展。目前,许多政府部门和重要行业已经开始积极有序进行应急管理、灾难备份与恢复体系的建设工作。

  近十年来,国土资源信息化建设发展十分迅猛,数据积累不断丰富,政务信息系统日渐增多,其安全性和稳定性显得愈来愈重要。一旦发生人为或自然等突发性灾难,造成数据丢失或信息系统严重故障或瘫痪,将会直接影响到国土资源管理工作的正常运转以及一些企业和广大民众的利益。灾备工作将成为国土资源信息化建设的一项十分重要的工作。本文对目前的灾备主流技术进行综述。

  2 灾备指标和类型

  灾难事件一般包括:自然灾难(如风、火、水、雷电和地震等)、人为灾难(如人为失误、非授权操作等偶然故障,病毒入侵、骇客及人为破坏等 Byzantine故障、恐怖袭击和战争等)和技术灾难(设备故障、软件错误、电信网络中断和电力故障等)。统计资料表明自然灾难(包括人为的战争和恐怖袭击等)仅占灾难的3%,人为灾难占灾难的39%(其中。偶然故障和Byzantine故障分别占32%和7%),而技术灾难占到灾难总数的58%.

  根据《信息系统灾难恢复规范》,灾难被定义为。由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件。通常导致信息系统需要切换到灾备中心运行。灾难恢复指的是,为了将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态、并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态,而设计的活动和流程。灾难备份指的是,为了灾难恢复而对数据、数据处理系统、网络系统、基础设施、专业技术支持能力和运行管理能力进行备份的过程。

  广义地理解,灾难备份(简称灾备)是指利用技术、管理手段以及相关资源确保关键数据、关键数据处理系统和关键业务在灾难发生后可以尽可能多且快地恢复的过程,包括灾难备份和灾难恢复两层含义。不仅包括灾难发生前对数据的备份和日志,信息系统构建过程中容灾体系结构的设计、提前制定的灾难应急预案与恢复计划等,而且涵盖了灾难发生后灾备中心或者备份系统的业务接管,数据、系统、服务迁移过程中的安全管理、系统灾难损失评估等内容。灾备的目的就是确保关键业务持续运行以及减少非计划宕机时间。

  衡量灾备系统的两个重要指标是:恢复时间目标(RTO,recovery time object)和恢复点目标(RPO,recovery point object)。

  RTO:恢复时间目标,以时间为单位。即在灾难发生后。信息系统或业务功能从停止到必须恢复的时间要求。RTO标志系统能够容忍的服务停止的最长时间。系统服务的紧迫性要求越高,RTO的值越小,灾备能力就越高。

  RPO:恢复点目标,以时间为单位,即在灾难发生时,系统和数据必须恢复到的时间点要求。RPO标志系统能够容忍的最大数据丢失量。系统容忍丢失的数据量越小,RPO的值越小。若RPO等于0,相当于没有任何数据丢失。否则,就需要进行业务回复处理,对丢失数据进行修复。

  RPO针对的是数据丢失。RTO针对的是服务丢失,两者必须在进行风险分析和业务影响分析之后根据业务的需求来确定。

  一般而言,灾备分为三个级别:数据级、应用级和业务级。其中数据级、应用级都属于IT系统范畴之内,而业务级则考虑到IT系统之外的业务因素,包括备用办公场所、办公人员等。

  数据级灾备的关注点在于数据,即灾难发生后可以确保用户原有的数据不会丢失或者遭到破坏。较低等级的数据级灾备可将备份的数据通过人工方式保存到异地实现,如将备份的磁带(盘或光盘)定时运送到异地保存就是方法之一。而较高级的数据灾备方案则依靠基于网络的数据复制工具,实现生产中心不同备份设备之间或是生产中心与灾备中心之间的异步/同步的数据传输,如采用基于磁盘阵列的数据复制功能。

  应用级灾备是在数据级灾备的基础上,对应用系统进行复制,也就是在异地灾备中心再构建一套应用支撑系统。支撑系统包括数据备份系统、备用数据处理系统、备用网络系统等部分。应用级灾备能提供应用系统接管能力,即在生产中心发生故障的情况下,灾备中心便能够接管应用,从而尽量减少系统停机时间,提高业务连续性。

  业务级是最高级别的灾备系统。它包括很多非IT系统,如办公地点等。当大的灾难发生时。用户原有的办公场所都会受到破坏。用户除了需要原有的数据、原有的应用系统外,更需要工作人员在一个备份的工作场所能够正常地开展业务。实际上,业务级容灾还关注业务接入网络的备份,不仅考虑支撑系统的服务提供能力,还考虑服务使用者的接入能力、甚至备份的工作人员。

  在灾备系统建设中,选择不同的类型。应该综合考虑数据与应用系统的重要性、业务关联度、技术成熟度、基础设施条件、成本和管理维护等一系列因素。
(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们