您现在的位置是:首页 > 行业 > 金融 >
证券行业要容灾备份双管齐下
摘要证券集中交易系统的建设正在对系统的安全性、可靠性和业务连续性等方面提出越来越高的要求。证券交易系统是一种典型的“任务关键型”应用系统,它的运行涉及数以百亿计的资金和大量的客户,并且,由于证券交易是一种实时行为,因此系统的安全与稳定尤为重要。...
证券集中交易系统的建设正在对系统的安全性、可靠性和业务连续性等方面提出越来越高的要求。证券交易系统是一种典型的“任务关键型”应用系统,它的运行涉及数以百亿计的资金和大量的客户,并且,由于证券交易是一种实时行为,因此系统的安全与稳定尤为重要。
因此,证券集中交易系统的安全灾备系统在需求上存在如下非常明显的特征。
1.可靠性要求非常高
证券集中交易系统的运行涉及数以百亿计的资金、涉及大量的客户,所以必需保证系统数据复制的极高的可靠性,必须做到数据的准确性。
2.要求延迟尽量小
因为大量的实时交易只有被及时地复制到容灾系统上以后,才具有抵御生产系统上各种风险的能力,必须要求做到秒级的延迟,并且要尽可能地缩短。
3.带宽有限
对于大量的证券用户来说,由于租用电信线路,因此线路的带宽成本将是灾备系统运行的一笔非常大的费用。在目前来看,各大证券行业的带宽大都只能确保在2M左右。如何在如此有限的带宽上实现实时复制、减少数据延迟,加快数据同步,是一个重要的问题。
4.交易查询分离
为了提高证券集中交易系统的高峰期业务处理能力,提高系统查询响应速度,提高客户服务质量,证券业普遍要求将查询与交易分离。
证券行业的主要风险
证券行业的运营支撑系统主要面临的风险如下:
计划内的风险。例如:应用软件等的升级、备份/恢复/归档、数据中心迁移、整合、测试、容灾演习等。
计划外的风险。例如:系统处理能力下降、人为操作故障、错误执行程序或命令、错误执行程序或命令造成的系统瘫痪和系统软硬件故障、生产地点的灾难等。
研究表明,在以上各种导致系统下线的原因中,各种原因的比例如下:40%的系统灾难是由于操作人员操作失误而引起,40%的系统灾难是由于应用软件的问题引起;20%的系统灾难是由于设备的物理原因引起,如硬件失效、掉电、自然灾害等。
由此可见,系统计划外风险主要是由于人为操作失误和应用软件问题造成的,真正由自然灾难带来的风险的发生几率非常小。
进一步分析,系统下线的原因主要可分为逻辑错误和物理错误。逻辑错误和物理错误的防范机制各不相同,主要的方法有定时拷贝和连续复制两种。
备份技术和容灾技术
备份技术(Point-in-Time Copy)是对业务运行过程中某一时刻的生产数据的保护。该保护在业务正常运行时生成,主要预防业务因生产数据的逻辑故障而造成的停顿。当生产数据因人为误操作或病毒破坏而损坏时,可以利用该定点拷贝将业务状态恢复到损坏发生时刻的正常业务状态。
容灾技术是对业务状态数据进行持续不断的复制。它主要是为了在业务系统遭遇灾难(如停电、火灾等)而造成物理错误时恢复应用进程。当灾难发生时,连续复制过程也将终止,在进行业务恢复时利用复制结果可以恢复停机现场的生产数据,从而恢复业务。
实际上,业务系统不能运行的主要原因就来自这两部分。因此在数据保护方面,需要采用容灾和备份相结合的原则。
灾备一体化应用
DSG公司针对证券业界的数据保护需求,推出了两类数据保护产品:容灾产品(RealSync)和备份产品(SnapAssure)。其中容灾产品(RealSync)是通过交易实时同步的方式实现数据备份,其目的是保护证券系统的业务连续性。而备份产品(SnapAssure)是每天进行一次数据备份(日常作归档日志的备份),其目的是保护证券系统的数据安全性。
西部某证券公司应用了SnapAssure+RealSync的一体化系统保护架构,其拓扑结构如下图所示,系统由本地备份系统、本地容灾系统和异地容灾系统三个部分组成。
本地容灾系统采用DSG RealSync实时复制技术,将交易系统的数据实时同步到本地容灾系统上。本地容灾系统用于集中交易系统因为硬件的问题而无法启动时,快速接管集中交易业务。
本地备份系统采用DSG SnapAssure产品,将集中交易的数据备份起来,形成两周的备份。通过这些备份,可以将数据恢复到14天内的任意一个时间点。该系统主要用于防范人为误操作造成的数据破坏。当历史数据遭到破坏,可以利用本地备份系统来恢复丢失的数据。
异地容灾系统采用DSG RealSync实时复制技术,将交易系统的数据实时同步到异地容灾系统上。应用的网络带宽为2Mbps。
异地容灾系统使本地发生电力故障、网络故障、火灾、地震以及其他环境故障时,业务可以在短期内快速接管至异地的容灾系统上,以确保业务不间断
(本文不涉密)
责任编辑:
上一篇:中国证券公司IT治理研究
下一篇:欧洲证券存储机构制定交割新标准