您现在的位置是:首页 > IT基础架构 > 计算存储 >
浅议数字信息的灾难备份
2013-03-04 10:08:15作者:郭庆贺 贺春亮 来源:
摘要数据灾备是为高风险、小概率事件所做的准备,本文通过对业务需求的分析以及在数据灾备上的实践体会,对数据的存储备份及灾难恢复技术中需要考虑的问题进行了有益的探讨。...
引言
灾难备份是指为了灾难恢复而对数据、数据处理系统、网络系统、基础设施、技术支持能力和运行管理能力进行备份的过程。目前许多用户为降低信息化建设和管理成本,采用集中方式进行信息系统的建设。而集中模式对应的风险就是一旦中心机房的网络、电源、计算机等出现故障,或者业务系统本身出现问题,以及发生火灾、地震、洪水等自然灾害,将导致相关业务系统瘫痪,影响系统的正常运行,甚至影响单位业务的正常开展,造成不可估量的损失。在遭遇一场灾难时, 信息系统恢复的首要目标是保障企业关键服务。灾难备份目前在政府、金融、电信、交通、能源、公共服务业及大型制造零售业等对信息化依存程度高的行业应用极其广泛。它的主要作用是政府或企业的信息数据生产中心遭遇自然灾难或人为侵害时,启用同城或异地建立的备份数据中心, 提供不间断的数据信息服务。
一、灾备需要考虑的问题
1.数据丢失的多少、以用灾难恢复时间目标和恢复点目标衡量的业务能容忍的停机时间是选择实现特定备份策略的两项主要因素。还有就是留存周期,即定义了业务需要备份复制的持续时间。有些数据需保存数年而另外一些只需临时保存几天。
2.文件的位置、大小以及数量会影响备份的过程,也是需要考虑的问题。对于将要备份的数据,所存放的位置是非常重要的考虑因素,很多组织机构具有非常多的异构平台以支持复杂方案。文件大小也会影响备份过程,备份多个小文件比备份相同数据量的单个的大文件要花费更多的资源,小文件在备份和恢复的过程中也将占用更多的时间。同理,备份文件数量也会影响备份进程。
3.备份粒度的选择。备份粒度的选择依赖于业务需要以及对恢复时间目标和恢复点目标的要求。根据粒度不同,可分为全备份、累计备份和增量备份。一般都是三种备份的组合来完成整个备份工作。全备份指在某时间点上对所有数据进行完整备份,增量式备份复制自上次全备份或最近的增量式备份以来修改的数据,由于只备份修改的数据,因此备份速度快,但恢复数据耗时。累积式备份复制最后一次全备份以来修改的数据,备份时间长但恢复速度快。
4.备份方法的选择。备份有热备份和冷备份两种方式。冷备份时应用需要停止,当数据库无法关闭时,就需要采用热备份,热备份应用仍处于运行状态,通过数据库备份代理来实现,不足在于备份代理会影响到整体应用的性能。
5.备份拓扑结构的选择。在备份环境中有三种基础的拓扑结构:直接连接备份、基于局域网的备份和基于SAN备份。在直接连接备份中,备份设备直接连接到客户端,只有元数据通过局域网发送到备份服务器,使得局域网从备份的数据流中解脱出来。而基于局域网备份,所有服务器通过局域网互联并且所有存储设备直接连到存储节点上,要备份的数据在局域网上从备份客户端传送到备份设备,会影响网络性能。基于SAN备份也被称为无局域网备份,在客户端间共享备份设备的时候SAN备份是最佳方案。
6.备份介质,有备份到磁带、备份到磁盘和备份到虚拟磁带库。磁带的优点就是成本低,但是数据读写是串行,使得备份和恢复都很慢;由于磁盘性能优异,成本低质量高,已经成为目前主流备份设备。
二、备份策略的选择
一方面用户运行的数据一定要做备份,而备份又是非常耗费资源的操作,因此用户希望备份对信息服务的影响越小越好。所以需要通过备份策略来找到最好的平衡点。备份策略有以下几个规则。
需要备份的数据有哪些。有效的备份策略应当可以区分很少变化的数据和经常变化的数据,并且对后者的备份要比对前者的备份更频繁。
备份时间的选择。管理员必须平衡可以接受的最长备份周期。以及备份资源消耗对信息服务的影响之间的关系,因为持续热备份会消耗大量的处理器资源、输入输出、网络容量以及大量存储空间。
备份策略的全局考虑。备份策略的参数有备份的客户端、文件和目录列表、介质服务器、介质类型和设备组以及信息排程。
三、对备份的一些优化措施
避免使用磁盘镜像来代替备份。磁盘镜像可以防止在线存储设备发生故障,但是如果文件被意外删除或者文件本身损坏,镜像磁盘上的文件也将是无法使用的,并且若镜像存储上的文件损坏,就相当于所有镜像都损坏。文件恢复只能从备份拷贝中恢复。
定期测试。无法读取的备份是没有意义的,备份磁盘应当定期测试其可读性和可恢复性,以保证需要恢复时的备份实时有效。
用多个拷贝保护重要的数据。用于购买、写入、运输和维护备份磁盘的成本要比数据丢失后重建数据的成本小得多,从灾难发生后的恢复性考虑,重要数据的备份至少有一份保存在远离主要数据中心的恢复站点是十分可靠谨慎的做法。
加密备份数据。如果客户端和介质服务器之间的网络路径不安全,正在备份的数据在网络中传输时,有可能被未经授权的第三方读取或修改。为杜绝这种可能性,应对重要敏感的数据进行加密。
尽量避免恢复的发生。通过统计,大多数情况是单个文件或者部分文件的恢复,而不是整个文件系统的恢复。对文件系统定期快照,可能不需要使用备份磁盘就可以恢复被删除的文件,但是快照并不能替代备份,备份是防止文件系统发生灾难的不可或缺的方法。
四、对数据库的灾备
数据库的备份必须是数据库在某一时间点的镜像,镜像中需要没有未完成的事物处理。可以通过数据库的冷备份实现。因为冷备份没有正在进行的事务处理。缺点是备份过程因为是冷备份,应用程序在备份时无法使用数据库。当然数据库备份也可以热备份,在热备份时,备份程序必须保证备份是数据库的一致性镜像。.
冷备份通过关闭数据库然后进行文件的备份,实现简单安全。但在实践中让数据库关闭然后备份很难实现,尤其是需要被全天候访问的用户。
目前大多数数据库都可以实现热备份。有两种基本方法,逻辑热备份和物理热备份。逻辑热备份是复制数据库的逻辑单元对象,而不是复制该对象的容器文件的内容,它通常与恢复、修复应用合并使用,产生错误备份的风险很小。缺点是不能使用存储快照技术来减少备份对应用的影响。逻辑热备份在备份过程中会很大程度的影响系统性能,所以不适用频繁使用的数据库。而物理热备份复制了数据库所包含的容器文件的内容。数据库容器文件并不是可以随时都可以复制,因为数据库管理系统在不断更新容器文件。使用中的文件的副本很可能包含只是部分完成的事务处理,而且也不能将数据库恢复到一致性状态。要确保一致性容器文件备份,数据库必须处于某个静止状态,没有正在进行的事务处理且没有数据正写入缓存。当备份完成后,数据库重新进行激活。也就是说这种备份运行时数据库无法使用,跟离线备份一样高效。
用户的数据库对可用性要求很高且内容是不断增长的,使得数据库全备份在很多情况下无法完成。可以通过增量备份缩短备份时间。
通过定期备份并将其保存到安全的地方,数据库就能从大多数灾难中恢复过来。恢复首先合并使用备份和日志,恢复数据库的基准镜像。对于无法预知的物理性灾难,在数据库基准镜像上执行数据库的完全恢复,可以使恢复点尽可能接近灾难发生时刻。而对人为或应用导致的逻辑灾难,被恢复镜像可以恢复到数据损坏前的那个时刻。
五、结语
备份是用户防止重要数据丢失的最后一道防线。在发生意外时,即使未作任何级别的数据防护,导致了重要文件丢失或删除,甚至发生整个数据中心损坏的灾难,备份都可以避免数据丢失带来的不利影响。在规划数据中心建设时,一定要重视数据灾备,不能把它作为最低的优先级来考虑,相反,可靠的定期备份必须是任何信息服务灾难恢复策略的最高优先级。
(本文不涉密)
责任编辑:
上一篇:大数据的缺陷
下一篇:档案管理系统灾难备份建设研究