您现在的位置是:首页 > IT基础架构 > 计算存储 >

双活数据中心实现业务零中断

2013-01-25 09:05:00作者:来源:

摘要从某种程度上说,双活数据中心本身就是一个云数据中心,因为它具有云计算所需的高可靠性、易扩展性、高可用性和极高的业务连续性水平。...

  出于灾备的目的,用户一般会建设两个(或多个)数据中心,一个主数据中心用于承载业务的运行,另一个备份数据中心用于备份主数据中心的数据和应用。一旦发生灾难,主数据中心宕机,备份数据中心可以快速恢复数据和应用,从而减轻因灾难给用户带来的损失。灾难是小概率事件,而采用一主一备这种方式,备份数据中心只在灾难发生时才能起到作用,这对于某些用户来说是IT资源和资金的浪费。因此双活数据中心的概念近几年开始流行。

  安徽中烟工业有限责任公司合肥卷烟厂(以下简称合肥卷烟厂)在易地技术改造暨“黄山”精品卷烟生产线项目中,建立了新的卷烟生产线和新的双活数据中心,为保证“黄山”精品卷烟生产执行系统等关键应用的安全、可靠运行提供了保障。合肥卷烟厂企管科工程师薛训明表示:“我们的生产执行系统对实时性和可用性的要求非常高,不允许出现宕机,否则将严重影响正常生产。因此,我们在规划新的数据中心时,采用了双活数据中心的模式。”

  虚拟化实现业务整合

  “黄山”精品卷烟生产线项目是安徽省改造提升传统产业、做大做强优势产业的一件大事,同时也是安徽省调整振兴轻工产业的重大工程。合肥卷烟厂在项目建设过程中,精心组织,规范运作,努力提升生产过程的系统化设计、精细化加工和智能化控制水平,并致力于打造具有核心竞争能力的新的卷烟生产基地。在这种背景下,合肥卷烟厂在配套的数据中心建设上投入了很大精力。薛训明介绍说:“依据以往的经验,并结合新的需求和技术发展方向,我们在新厂房所在地规划建立了双活数据中心,两个数据中心位于相隔一公里远的两个不同的建筑物中。我们的大部分应用都已运行在以VMware vSphere 为底层技术支撑的IT基础架构之上。未来随着老厂房向新厂房逐渐搬迁,更多的应用将运行在VMware vSphere基础架构之上。”

  合肥卷烟厂的原有IT系统都是各自为政的,每上一个新的应用系统,就会单独为此配备一套IT设备,有时还要配备冗余的服务器或存储设备。这样做的结果是,各个应用系统之间是相互隔裂的,很容易形成信息孤岛,不仅管理复杂,而且很难保证业务的连续性。因此,在建设新的数据中心时,合肥卷烟厂果断、全面地采用了虚拟化技术,包括服务器虚拟化、存储虚拟化以及桌面虚拟化,并以VMware vSphere为技术核心,实现了双活数据中心同城异地容灾,当一个数据中心出现宕机时,另一个数据中心可以即时接管业务,避免应用宕机。

  作为本项目的系统集成商,安徽中科大国祯信息科技有限责任公司技术支持中心总经理谢飞介绍说:“现阶段,很多用户只会使用一两种虚拟化技术,如服务器虚拟化或存储虚拟化,而合肥卷烟厂将服务器虚拟化、存储虚拟化以及桌面虚拟化等多种虚拟化技术很好地结合在一起,不仅提升了业务连续性水平,而且构建了弹性的IT基础架构,实现存储、服务器、桌面资源的按需分配和使用,效果很好,特别是在灾备方面,完全达到了当初的设计目标。”

  “以前,我们从来没有应用过虚拟化技术。随着研究逐渐深入,我们发现虚拟化技术已经是一项很成熟的技术,它对于提升信息化管理和运维水平有很大促进作用。”薛训明介绍说,“虽然许多厂商都能提供虚拟化解决方案,但是经过调研我们发现,VMware的虚拟化产品市场占有率最高,而且技术应用最成熟,成功案例最多,所以我们最终选择了VMware vSphere及相关产品。现在,包括生产执行系统在内的许多与生产经营有关的关键应用都运行在VMware vSphere虚拟化平台之上。以前,我们只看到金融领域的客户采用过双活数据中心的架构,而现在,我们的双活数据中心架构以VMware HA(高可用性)软件为依托,很好地保障了业务的连续性。”

  在制造业领域,双活数据中心的应用还比较少。因此,合肥卷烟厂在规划其双活数据中心时没有太多的成功经验可循,只能是自己摸着石头过河。“在采用服务器虚拟化技术之前,我们也曾经考虑过可能遇到的技术风险,比如如何应对大量数据的实时存储以及I/O的高吞吐量等问题。”合肥卷烟厂企管科的另一位工程师苏明介绍说,“VMware提供的一些官方测试数据消除了我们对I/O高吞吐量的担心。在存储方面,我们基于双活数据中心架构,在两个数据中心里都配备了相应的存储设备,避免了‘所有鸡蛋都放在同一个篮子里’的尴尬。目前,我们80%~90%的应用都运行在基于虚拟化技术的双活数据中心里。”

  提升业务连续性水平

  从实践效果看,双活数据中心的最大优势在于可以提高整个IT系统的可用性,保证业务的连续性。“通过采用双活数据中心设计,我们的IT系统的灵活性和可用性都有大幅度提升,能够实现最高级别的业务连续性。”薛训明说,“我们一共采用了8台x86服务器,每个数据中心各部署4台,并相应地配备一套存储系统,从而构成了一个基于VMware vSphere的集群环境。应用系统可以在数据中心本地以及数据中心之间,根据业务的需求进行迁移,从而增强了业务部署的灵活性。”

  合肥卷烟厂实际的测试数据显示,在出现计划外宕机事故时,基于VMware HA技术的双活数据中心可以在不到1分钟的时间内在备用数据中心重启应用;在计划内停机时,利用VMware vMotion技术,可以将应用虚拟机从容地从故障数据中心在线迁移至另一个数据中心。薛训明表示:“相比原有的主机镜像模式,我们采用的双活数据中心模式可以大大降低系统部署与管理的复杂度,满足数据处理的实时性和可用性双重要求。”

  在双活数据中心模式下,合肥卷烟厂采用的Oracle RAC并行数据库可以实现跨站点部署。两个Oracle RAC节点分别部署在两个数据中心(Oracle RAC 1部署在数据中心1,Oracle RAC 2部署在数据中心2),即使数据中心1发生故障,也不会影响到运行在数据中心2里的Oracle RAC 2应用。VMware HA还可以保证数据中心2自动重启原来运行在数据中心1的Oracle RAC 1应用。薛训明介绍说:“我们的生产执行系统的后台数据库为Oracle。为实现高可用性,我们采用Oracle RAC并行方式。相比运行在物理架构上,运行在VMware虚拟化平台之上的Oracle RAC不仅可以实现更高级别的业务连续性,而且可以在线进行维护和扩容。”

  借助VMware vMotion技术,合肥卷烟厂可以在线迁移Oracle RAC节点,从而避免了硬件维护时的应用部分中断。此外,通过VMware Hot-Add技术,合肥卷烟厂还可以在线增加RAC节点虚拟机的CPU数量以及内存容量,从而避免了硬件扩容时的应用中断。

  为了保证业务的连续性,合肥卷烟厂采用了多种技术的组合,包括容错、容灾等。企业服务总线承载着企业内部各业务系统间的通信,一旦宕机将导致业务系统通信中断。合肥卷烟厂采用VMware Fault Tolerance技术来保护企业服务总线虚拟机。合肥卷烟厂模拟硬件故障进行测试的结果显示,VMware Fault Tolerance保护的虚拟机仅丢失了一个Ping包,几乎可以满足零宕机的保护要求。

  按照规划,在项目一期中,合肥卷烟厂部署的8台服务器最多可支持40~50个虚拟机,目前正在运行的虚拟机有10几个。“我们的主要应用都已经运行在虚拟基础架构之上。基于VMware vSphere技术的虚拟机性能表现优异,完全能够满足我们对性能和可用性的要求。”苏明表示,“在使用虚拟化技术以前,我们的服务器利用率比较低,而且服务器的部署和管理都比较麻烦。采用VMware vSphere虚拟化技术以后,一台物理服务器上可以运行8~10个应用,不仅提高了服务器的利用率,能够从容应对业务的高峰期,而且应用的部署与管理也变得十分简单。”

  如今,合肥卷烟厂已经构建起了虚拟化的服务器资源池和存储资源池,应用与硬件无关,实现了松耦合。如果因为新应用上线而造成硬件资源不足,那么合肥卷烟厂只要新采购一台服务器或存储设备,加入虚拟化的资源池即可实现轻松扩展。利用虚拟化技术,合肥卷烟厂将原来分散的业务系统及IT系统实现了有效整合,从而提高了整个系统的利用率和可用性。

  私有云的基础

  苏明介绍说:“当初在进行数据中心设计时,原计划是满足未来3~5年的应用需求。由于采用了虚拟化的架构,IT资源完全池化,我们的IT系统可以根据应用需求轻松实现横向扩展,并且应用与硬件无关。”

  在国内,我们也看到了其他一些基于VMware全虚拟化环境的双活数据中心的成功应用。基于虚拟化技术和双活数据中心模式,虚拟机从一个数据中心切换到另一个数据中心,切换时间接近于零。VMware HA是实现双活数据中心的重要工具。借助VMware HA软件,虚拟机的重启时间保持在毫秒级,用户根本察觉不出来,从而提升了企业的业务连续性水平。

  从某种程度上说,双活数据中心本身就是一个云数据中心,因为它具有云计算所需的高可靠性、易扩展性、高可用性和极高的业务连续性水平。对于前端用户来说,双活数据中心就是一个逻辑上的大数据中心,它可以实现应用与硬件的松耦合,不仅能够满足应用对性能、可用性的需求,而且可以灵活扩展。

  连接

  双活(甚至多活)数据中心是指两个(或多个)数据中心同时承载业务,不分主备,而是互为备份,在一个数据中心站点出现故障时,另一个站点可以即时接管业务,保证业务不中断。相较于传统的建设一主一备数据中心的方式,双活数据中心减少了IT资源和资金的浪费,可以更好地保证数据和应用的实时性以及业务连续性,最先被金融、电信等对IT的高可用性和业务连续性有极高要求的用户采用。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们