您现在的位置是:首页 > 行业 > 金融 >
[独家]首创证券伏劲松:IT自动化 运维新境界
2012-01-29 15:17:00作者:洪蕾 郝峥嵘来源:
摘要证券是个“高压”行业,如何将人为误操作导致的系统故障率降至最低,ITIL为IT运营勾勒了一幅完美远景。...
【中国信息主管网独家】证券是个“高压”行业,IT人员一次操作失误可能带来系统100%的出错几率,其后果严重性也与其他行业相比被放大无数倍。如何将人为误操作导致的系统故障率降至最低,如何减少IT运维人员的无效率工作,如何用最少的资源提供最多的服务, ITIL为IT运营勾勒了一幅完美远景。
正因如此,首创证券技术总监伏劲松2003年就开始ITIL的研究,通过团队组织学习吸收ITIL概念,经历过理论与实践的碰撞,遭遇了CMDB架构的裹足不前,再到转投IT自动化怀抱。伏劲松对ITIL的落地实践自有体会,并基于首创公司系统现状,与第三方企业合作开发了一套证券公司IT自动化运营管理系统。
为了分享平台建设经验,探索IT自动化运营在证券业的现实意义,中国信息主管网独家采访了首创证券技术总监伏劲松。
重新认识ITIL IT自动化是ITIL的高级阶段
说到首创证券的IT自动化运营管理系统,不得不提到一个20年前就很热门的概念——ITIL,这个概念也是最初首创证券CIO伏劲松探索IT运营管理的切入点。
首创证券CIO 伏劲松
2003年,伏劲松就带领公司IT团队开始学习、消化ITIL理念。“我们碰到的第一个棘手问题就是CMDB(Configuration Management Database,配置管理数据库)的构建。创建时需要收集哪些信息?哪些信息是我们必须的?如何满足配置项属性的‘精而不多’原则,为此我们部门开会讨论不下10次,耗费了很多心力。”谈及此,伏劲松一脸无奈。
其实,企业在实施ITIL项目的时候,配置管理常常被视为项目的“鸡肋”——食之无味,弃之可惜。耗费大量人力和时间收集上来的各类IT基础架构信息最后却成为一个包袱——一个及其复杂而难以维护的“IT基础架构信息库”。
被CMDB构建牵扯不少精力的同时,2004年,首创证券开始陆续上线监控系统——防火墙监控系统、流量分析监控系统、网管监控系统等。“我们一边搭建系统,一边尝试在ITIL这条路上继续摸索。”伏劲松坦言。
将网管系统打造成一个集成监控系统,伏劲松也曾有过这个想法。“但这种做法在证券公司缺乏现实基础。首先,不同监控系统的供应商之间存在技术壁垒;其次,国际主流厂商的产品已经标准化,无法提供适合我们公司IT环境的产品;再次,国内的相关厂商也是鱼龙混杂。因此,集成网管系统这条路行不通。”
如果说ITIL项目实施和集成网管系统这两条路遇阻碍,最终促成了首创证券IT运营管理系统建设的另辟蹊径,那么,IT自动化技术则为后来的平台搭建工作提供了一个坚实基础。
“在真正了解IT自动化之后回过头看ITIL,我觉得ITIL存在两个问题:其一,ITIL看上去似乎很完美,但实施周期太长,流程繁琐,而我们面临的是要快速解决工作中所面临的实际问题;其二,ITIL回避的一个关键问题——人,它默认人能够正确执行ITIL所描述的规定流程,但实际工作中这需要很长的时间去磨合。证券公司经常进行应急演练规避各种风险,而一旦问题产生,在强压之下人的动作难免不会变形。要让所有流程都能稳定准确地执行,只能交给机器去做,也就是IT自动化。”伏劲松道:“IT自动化是ITIL的高级阶段,它已经做得比ITIL更好了,我觉得可以把ITIL丢掉。”
感触IT系统健康状况的神经中枢
认准了IT自动化这条路,首创证券开始系统规划实施。
证券公司的IT环境有其特殊性,与交易所、银行以及分支机构的系统接口都有差异,证券公司自身几乎没有太多话语权。标准的不统一让整合工作变得十分必要也使之成为不少企业信息化建设过程中难以跨越的一个关键点。
从首创系统当时的系统现状来看,防火墙监控系统、流量分析系统、网管系统等多个系统各成一脉,对应了多个“处理中心”。这样导致的后果是信息相互孤立,当问题发生时无法准确进行定位。
“对证券公司而言,系统安全稳定是运维工作的首要重点,但运维人员长期处于高压力环境下工作,工作内容又琐碎繁多、重复性强,很容易形成疲沓工作状态,导致人为操作差错出现。我们目前的多个系统使我们管理的对象,监控系统就是一个感知应用系统健康状况的神经系统。但是如何高效地获得系统各种信息,我们就把这些监控系统集成到一个平台上,让平台成为我们系统的神经中枢。通过这个神经中枢,我们能够更准确地感触整个系统各个环节上的健康状况。”
据伏劲松介绍,首创证券IT运营管理系统由三大组成部分组成,第一部分是监控系统,通过一个平台实现多种监控信息的收集、聚合、关联;第二部分是处理流程,我们建立规则库对问题的处理设定一个处理流程;第三部分就是根据流程操作执行,我们也把它们集成到了一个平台上。
规则库的建立不可回避,这也就回到了当初ITIL实施中面临的问题——如何创建CMDB。
伏劲松介绍说:“我们创建CMDB的方式比较有特色,通过把配置信息换成脚本,我们使CMDB能够面向整个系统,这样会很灵活。而且,这种做法也不会耗费我们很多时间,可以使我们把精力放在解决问题上。当我们发现某个问题而CMDB上没有相对应的配置信息时,我们只需要更新并重新发布一下脚本即可。”
据伏劲松介绍,在对IT运营管理系统进行优化的过程中,他会考虑将IT自动化作为一种运营工具,形成对意外事件应对解决的一个学习机制。通过IT自动化来研究如何有效地分析采集信息,定位问题。
解放人力和资源 让系统更安全
如果计算机事故70%是由人为差错造成这种说法成立,那么引入IT自动化,对IT运营工作而言带来的最大好处是系统安全性得到了提升。 “举个例子,目前应对容量预警问题,我们可以迅速地定位问题原因,有效解决。”如伏劲松所言,基于IT自动化运营管理平台,IT运维工作更为轻松。
“另一方面,IT自动化也是对人力资源的充分解放。目前公司的日常IT运营、运维工作总共只有三个人来承担,能够将另一部分员工的时间释放出来,聚焦在技术架构、合规管理、项目管理等更高层次的工作上,同时,也能够让我们有足够的人力来更深层次地优化既有IT自动化运营平台和整个IT架构。”伏劲松介绍道。
证券IT运维工作需要操作人员强烈的责任心。即便个人的失误概率很低,但是因为系统的复杂性是呈几何级数方式增长,需要关注的地方太多,在向超出人所能及的方向快速发展,哪怕是一次失误,也有可能带来100%的出错几率。在证券公司,每个交易日开市前都需要进行系统检查,这一过程中一旦产生人为疏忽导致的系统故障,在高压力状况下,就很难迅速对故障产生原因进行定位和排除。而自动化解决方案可以确保几乎是百分之百的精确度,可以使重复操作的成本降低到很小。
对管理者而言,IT自动化运营管理系统建成后,伏劲松能够带着它的团队轻装前行,对业务变化的反应也能更为敏锐。与此同时,对系统的优化也在不断进行中。“我们的终极目标是让系统变得更智能,实现彻底无人值守。”
“如果我们能够让IT自动化成为一种运营工具,如果IT自动化系统变得足够智能,我们可以在闭市后,在与交易所以及第三方托管银行没有数据传输需求时,将很多设备关掉。另外,公司业务的后台支持设备也可以关闭。这样,我们至少可以为公司节约50%的电能耗。”伏劲松说。
完善的流程与正确的技术、人的进步以及成本平衡因素等相互结合,无疑会产生高效率的优质服务。当然,在伏劲松看来,系统需要持续优化,未来,还有很多工作要做。
精彩观点:做IT自动化是自己解放自己
IT自动化是对自己的解放。一些机械化的重复的工作应该交给机器去做,这样人就能轻装前进,并从更高的层面帮助企业IT系统的进化、完善。
(中国信息主管网独家,转载请注明出处)
(本文不涉密)
责任编辑:
上一篇:相对vs绝对 湿度如何起作用?