您现在的位置是:首页 > IT基础架构 > 计算存储 >
虚拟化容灾策略:增强业务连续性
摘要虚拟化在硬件层和操作系统应用层之间创建了一个抽象层,从而为灾难发生后的系统恢复提供更好的灵活性。很多虚拟化平台支持故障发生后的自动迁移和在其它硬件上重启虚机。然而,这仅仅解决了业务连续性和容灾恢复规划中的一部分内容。...
在故障发生时保障正常运行时间和可恢复性是很多虚拟化专家的核心工作内容。同时,相比传统服务器,虚拟化降低了部署业务连续性方案的门槛,不过相关工作依然很复杂,具体容灾策略根据各个公司的特点差别也很大。
虚拟化在硬件层和操作系统应用层之间创建了一个抽象层,从而为灾难发生后的系统恢复提供更好的灵活性。很多虚拟化平台支持故障发生后的自动迁移和在其它硬件上重启虚机。然而,这仅仅解决了业务连续性和容灾恢复规划中的一部分内容。
虚拟化架构还需要满足核心应用和数据的保护问题,有多少数据丢失以及应用和数据停止服务的时间多长等等。一旦他们明确了这些问题,就可以选择合适的备份、复制、集群和自动化解决方案来达成目标。
虚拟化降低了容灾恢复难度
虚拟化取消了对硬件的依赖性,从而降低容灾方案的挑战。在对服务器做虚拟化时,它们被打包成虚机,实现从底层硬件的剥离。因此,在主站点和备用站点不再需要配置完全相同的物理服务器。
虚拟化还提供了高可用、备份和复制等高级功能,这些在传统模式下都是作为选件。虚拟化平台通常包含了可以把虚机从宿主机复制到另一台,或把虚机从某个SAN迁移到另一个,或者在宿主机故障时提供高可用功能。由于虚机文件是由数据块组成的,可以轻松地对它进行跟踪、备份和复制,这和在虚机内做改变一样简单,极大提高了可恢复性。
不同于传统的物理服务器技术,这些功能适用于所有的虚机,而不限于某个OS或运行的应用。
物理服务器的整合也极大地节约了成本。备份站点的服务器和存储通常成本较低,因为虚拟化之后的服务器可以以很低的成本完成复制。最后一点,在虚拟化下,DR规划和故障切换测试也简单地多,可以对所有服务器进行而不是仅对某一台,测试成本也非常低。
下半部分我们介绍如何规划虚拟化环境容灾策略。
规划虚拟化环境容灾策略
虚拟化相比传统系统提供了很多容灾方面的优势,不过为虚拟架构开发BC/DR规划的步骤却基本类似。任何容灾规划的核心都是决定哪个系统和数据最为关键,然后为其定制一个可靠的容灾恢复策略来保护。下面是具体步骤:
·从管理者获得对创建和测试容灾规划的时间和预算要求
·列出潜在的灾难情形,并根据规模和影响进行分类
·文档记录和分析现在数据中心的架构,包括内部运行的应用和数据(例如所有的服务器、存储、网络、应用、电源和风扇需求归档)
·对现有容灾恢复策略进行分类列表,以及各自和数据中心的关联性(例如,需要配置备用发电机,可支持在停电后24小时内的供应)
·定义服务级别期望和应急计划
·搭建和测试BC/DR规划
每个公司实现DR的方式不同,但是核心应用类似。多数企业都有几个核心应用作为主业务的骨干网支撑。多数都拥有沟通用的系统(例如email、VOIP电话系统,以及内部SharePoint站点或内部即时信息系统)。为支持这些关键功能,企业需要部署DR规划和工具用于灾难发生后的应对。这个过程很简单,用PDF来记录规划和需要采取的步骤,和IT人员用笔记本通过远程VPN 访问到容灾站点类似。
所有的企业都应该理解和定义其服务器和应用的RPO(恢复时间点)和RTO(恢复时间目标)。这些数据的定义如下:
·RPO:灾难发生后最长允许丢失数据的时间段。例如,如果您的公司可以忍受24小时内的数据丢失,在每天夜里完成备份;您的恢复时间点目标就是之前的24小时。
·RTO:公司可以允许的最长应用停机时间。例如,如果您的邮件系统RTO是4个小时,DR规划应该设计为所有的邮件服务应该可以在四个小时内恢复,以满足目标。
虚拟化使得RPO和RTO的实现更为容易。核心的虚机可以复制到备用数据中心来防止数据丢失。为了防止数据损坏,虚机需要每个小时备份一次,以实现多个数据恢复点都可用于恢复。
如果要防止服务器宕机或虚机内OS崩溃对应用的影响,需要用到hypervisor内置的高可用功能,在宕机后把虚机自动复制到另一台宿主机(或在操作系统反应慢的情况下自动地重启)。
(本文不涉密)
责任编辑:
上一篇:本地备份和异地容灾系统建设研究
下一篇:虚拟化容灾策略:增强业务连续性