您现在的位置是:首页 > 行业 > 金融 >

从“7·5”事件看期货IT风险管理

2010-03-03 21:55:00作者: 来源:

摘要信息系统的风险存在于信息系统生命周期的各个阶段,在进行信息系统建设前期就应充分考虑信息系统投入运营后可能遇到的风险和各类紧急事件,以及化解风险的各种手段。下面就以新疆 “7·5”事件对宏源期货公司信息系统的影响来探讨信息系统风险的管理。...

在期货行业的发展过程中,随着期货业务对计算机信息系统的依附程度日益增加,业务和技术的融合程度日益紧密,信息系统在保障期货公司正常业务运营方面显现出越来越重要的作用。

信息系统发生故障将对期货公司业务运营产生重要影响,甚至对期货公司是一场不可挽救的灾难,因此加强信息系统风险管理能力成为当前信息系统管理建设的一项重要内容。

信息系统的风险存在于信息系统生命周期的各个阶段,在进行信息系统建设前期就应充分考虑信息系统投入运营后可能遇到的风险和各类紧急事件,以及化解风险的各种手段。下面就以新疆 “7·5”事件对宏源期货公司信息系统的影响来探讨信息系统风险的管理。

应急处理的主要措施

乌鲁木齐 “7·5”事件发生后 ,政府通告暂停互联网出疆业务,因此新疆用户无法访问疆外互联网地址。新疆营业部交易运行岗与总部联系后,通过总部客服中心的短信平台向营业部所有客户发短信告知情况,并开通三条紧急报单专线进行人工报单,并在开盘后每隔 5分钟通过手机短信向客户发送期货行情信息。另外清查营业部员工到岗情况,对营业部所有电器、网络设备、后备电源等进行检查,确保设备运行正常。

宏源期货公司在新疆营业部信息系统规划建设时就考虑到线路故障的风险,所以部署了电信和网通各一条光纤互联网线路和北京总部的信息系统进行链接。

但此次事件发生后,疆内互联网线路都被切断,新疆营业部的信息系统无法访问位于疆外的交易服务器和行情服务器,交易受到了很大影响。

所幸的是,新疆营业部和总公司在同一栋大楼内,并且总公司灾备中心有数字专用线路与北京总部连接,通过与总部证券公司信息技术部紧急协商,通过总公司灾备中心的专用线路连接到北京总部交易系统,保障了疆内营业部客户网上交易的畅通。

为解决疆内客户无法访问疆外行情服务器的问题 ,通过总公司灾备中心与北京证券总部的数字专线访问互联网,进行期货行情疆内转发,提供疆内客户查询相关期货行情资讯信息。

意料之外的问题

在解决了疆内客户期货交易及行情的使用问题后,又发生了意料之外的事情。

随着客户对疆内服务器访问量的不断增大,有部分客户反映登录我疆内营业部行情系统时,需要多次登录才能成功登陆到服务器。经过多方问题排查,发现是新疆营业部信息系统用户承载能力不够,导致系统压力过大 ,处理能力严重下降。当初在设计新疆营业部信息系统方案时,是没有考虑提供客户互联网访问服务功能的,疆内客户是直接访问疆外的交易及行情服务器。

因乌鲁木齐 “7·5”事件发生后临时搭建的疆内行情服务器并不是专业服务器,是由工作站临时改建用做行情服务器,疆内行情服务器在用户访问量达到 200人以上时磁盘读写 I/O值在 50%左右,峰值最高到 100%;同时,在排查问题的同时发现新疆营业部网络系统处理能力也存在着问题,与网络设备提供商的技术支持工程师进行了沟通,通过对营业部网络系统进行分析和问题查找,发现网络设备也存在着很大的压力瓶颈,影响着营业部信息系统的整体网络处理能力。

刚才提到,当初在设计新疆营业部信息系统方案时是没有考虑提供客户互联网访问功能的,因疆内客户无法访问疆外服务器,随着疆内客户对新疆营业部系统的访问量增加,网络系统同样不堪重负,超出预期。

 

在了解到问题的症结后,新疆营业部和总部信息技术部沟通确认方案,紧急购置部署了专用的高性能服务器用作疆内行情转发及客户交易,同时根据疆内当前互联网用户数及未来一段时间的发展预期,购置并部署了新的高性能的互联网网络设备,并对疆内的互联网线路进行了扩容,增加了带宽,避免线路拥挤造成行情及交易的延时影响客户使用。

经验与教训

在和疆内其他期货公司及证券公司沟通学习过程中,了解到因为各公司备份应急手段不一,此次事件对疆内期货有的公司影响不很大。

有的期货公司仍保留有卫星微波通讯方式,在此次事件发生后仍可通过卫星访问疆外服务器;卫星微波通讯因设备昂贵,维护不方便,带宽有限,易受干扰,所以我们规划营业部信息系统建设时没有考虑,但此次事件反而成了有效的通讯方式。

有的公司与疆外采取的是专用数字线路链接,有的是疆内公司总部和疆外营业部直接部署专线链接,有的是疆内公司总部到行情供应商疆外总部机房部署专线链接,他们在此次事件中影响也很小。

通过对同行业的参照学习,总结了以下几点主要教训:

一是信息系统规划建设除了考虑目前系统运行状况及承载能力,也要充分考虑系统未来的处理能力可以应对将来一段时间内业务的快速发展,以及紧急事件发生时对系统的压力影响,不能为了单纯的节省成本,牺牲系统扩展性能。

二是事前对信息系统风险的评估不足,考虑的应急措施不够全面,虽然考虑了多种紧急情况及应对措施,但是仍有疏漏,而且很多是在套用其他应急预案的基础上建立起来的,没有很好地结合本地、本业务的具体情况。

三是从形式上看现行的应急措施注重内部应急机制建设,对外部因素估计不足 ,比如此次事件中我公司新疆营业部虽有备份线路,但因到疆外的互联网线路都被切断而失效。

另外 IT系统应急有别于公共应急,具有很强的专业性,在制定应急处理预案以及在人员、设备、流程等方面的考虑不能只盯住本单位内部,也应加强对外部基础设施等问题的考虑。

四是事件发生后对风险事件对信息系统的影响后果评估不足,对事件缺乏敏感性,没有及时采取有效措施进行系统加固及补救措施,而是在系统问题影响显现后才被动的采取挽救措施,虽然经过努力也解决了问题,但是缺乏系统性,头痛医头,脚痛医脚,不能从根本杜绝此类问题的再次发生。

 

五是应建立信息事件应急协作机制,金融业信息系统大都是技术复杂的大型 IT系统 ,要依赖多家厂商、集成商、运营商的产品和服务,有极强的专业性 ,在灾害、事故发生的紧急情况下,依靠自身力量往往无法完成对所有故障节点的控制 ,所以要加强应协作,在问题发生后能调动各类资源及时处理。

六是完善应急处理措施,并及时采取应急处理手段进行补救。信息系统的风险存在于信息系统生命周期内的各个环节,不可能避免,关键是做好对有可能遭受的各类风险进行评估,根据评估结果开发、制定相应的应急预案,并做好演练和复审工作以保障应急预案的有效性。

从风险的应急管理角度看,风险应急管理可以分为灾前预防准备阶段,灾中应急响应、评估、处置阶段,灾后恢复补救三个阶段。当然最重要的阶段不是灾后恢复补救,而在于灾前制定针对企业所面临风险的应急预案,并进行不断地复审、演练,以保证应急预案的有效性。

因此加强信息系统风险应急管理是期货公司信息化建设的一项重要工作内容,应进一步加强信息系统风险应急管理工作,提高应急响应、处理和故障恢复能力,确保信息系统安全、稳定运行,而要真正实现完善的信息系统风险管理未来要走的路还很长。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们