您现在的位置是:首页 > 行业 > 制造 >

工程机械企业IT灾备系统建设

2013-10-15 15:45:06作者:杨波来源:

摘要分析了容灾备份能力关健指标RPO和RTO与IT核心系统的关系,以广西柳工机械股份有限公司的灾备系统建设为例进行分析与阐述,提出了一条企业TI灾备系统的建设思路。...

  如今,信息已成为企业生存发展的必不可少的元素。随着越来越多的企业认识到TT系统在信息处理过程中的迅捷和高效,ERP(企业资源计划)、PLM(产品生命周期管理)等各种类型的rT系统相继在多个企业中得到运用。IT系统在加速企业信息处理流程的同时,也产生了更多的数据。各类主数据、交易数据、电子文档、报表是TI'系统最重要的数据,这些数据对绝大部分规模以上企业来说,是支撑企业存在和发展的信息化基石。对这些数据的保护重要性不言而喻。信息技术的应用程度越高,数据的备份就越显得重要。在很多关键业务系统中,存放在机器上的数据往往比机器本身还要昂贵,因此对系统和业务数据的备份就成为非常重要的工作。备份的目的是在系统出现故障或灾难时能够快速地恢复系统或数据。要能够做到快速灾难恢复,就必须设计好灾难恢复方案,选择一个可行的备份策略。

  顺应数据大集中的趋势,很多企业均已建设或在建设自己的数据中心。企业绝大部分信息系统都在数据中心内运行,IT系统承载着公司的各项业务,进一步促进信息系统的集成和整合。将分散的数据集中到了一起,零星数据变成了海量数据,数据量从原来的几GB到几十GB,变为了几百GB到几TB,甚至几十TB,大数据的概念也由此而来。数据量的剧增也给备份和管理带来了机遇和挑战。首先数据的集中存放,使集中备份成为可能。然而,要实现对海量数据的集中存储备份和统一管理,采用原有的传统磁带机、磁带库等备份设备的备份方案很难达到备份目标。磁带或CD备份是一种最便宜的方法,也是较为有效的方法,但是它的恢复却是最慢的。而磁盘热备份与全系统热备份的成本就比较高,但它的恢复速度是非常快的。因此,连续数据保护、虚拟带库、重复数据删除等先进备份技术应运而生,这些技术的出现,对于构建新型高效的灾备方案,保证业务数据的高效及安全,提供了强有力的技术支持。

  1.现行国内工程机械行业IT灾备模式分析

  对国内一些主要工程机械企业的研究表明,这些企业在IT系统建设上都有很多共性:(I)用于业务支持的1T系统很多,核心的ERP系统采用国际上较为完善和通行的大型应用软件,如SAP或ORACLE系统,对IT系统的支持和保障要求很高。(2)园区内都有两个或两个以上的机房或数据中心。(3)核心IT系统都采用高端存储设备,使用光纤SAN链路,有一定的数据容灾能力,但是没有完整的应用容灾系统。(4)大型IT项目建设的时间跨度很大,在IT建设的各个阶段逐步引人多种技术方案,各个方案的建设需要保持平缓过渡,有利旧要求,以实现对原有投资的保护,降低IT的建设成本。

  工程机械企业园区占地面积较大,有条件在几百米甚至上千米外的同一园区内建设自己的另一数据机房,如另一栋楼、另一片厂区等,使得本地灾备系统可以建立在本园区内的另一机房。虽然不能避免地震、洪水等自然灾害,但是通过合理地设计和配置,已经可以在很大程度上避免火灾和停电等外部因素的影响。通过在园区机房间内建立FCSAN网络,使得备份可以得到较高的效率和较好的成本控制,免去了租用高成本的光纤链路与额外的人力资源管理成本。

  对于核心应用系统的保护,最基本的是要避免系统的单点故障。主机端使用双机热备技术,网络端使用双核心的架构,存储端使用镜像或连续数据保护系统,通过以上对应用系统的规划设计,基本上可以避免主机、网络、存储端的单点故障。通过连续数据保护系统还可以降低逻辑错误、误操作等风险。

  制造业对IT投人的成本较为敏感,在满足企业对IT系统数据备份要求的同时,希望降低TT总体拥有成本(TCO)。通常情况下,由于SAP, ORA-CLE等大型ERP系统使用高端的小型机服务器,出于成本方面的考虑,园区内的主机房通常用于存放一套核心和主要业务系统,并对核心数据进行保护。园区内的备份机房主要用于存放备份设备及部分其他应用。而工程机械行业的离散制造的特征,决定了企业对IT的投人需要按实际情况分阶段进行投人,并且各阶段的TT建设需要保持连续性,以保护原有投资,避免重复投资和浪费。企业的灾备系统建设只有适应该特征,才能在满足需求的基础上制定出性价比最优的方案。

  数据备份系统通常会通过两个最重要的指标来进行评估:RPO和RTO。RPO(Recovery Point Objective),即数据恢复点目标。主要用于评估业务系统所能容忍的数据丢失量,在同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO为异步传输数据排队的时间,对于时间间隔较大的数据备份而言,RPO等于连续两次成功备份的时间之差。RTO(Recovery Time Objective),即恢复时间目标。主要用于评估所能容忍的业务停止服务最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间。RTO描述了应用恢复过程需要花费的时间,即从恢复过程开始到恢复过程成功完成所经历的时间。fITO值越小,代表灾备系统的恢复能力越强。RPO和RTO的关系如图1所示。

  

图1 RTO和RPO示意图
图1 RTO和RPO示意图
(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们