您现在的位置是:首页 > IT基础架构 > 计算存储 >
存储分析:谁真正需要横向扩展系统?
摘要过去基于纸张办公的传统行业,现在发现自己面临的数据存储压力越来越大。但横向扩展的NAS系统就可以为高性能的应用提供支持。 ...
在此之前,你可能没有考虑过你的IT部门需要一个横向扩展(也称向外扩展)系统。在如今环境多样化的状况下,横向扩展系统将会具有深远的影响。由于某些行业需要存储大量的文件,因此需要足够的访问带宽才能满足应用对性能的要求,因此对外扩展系统已经首先在网络附加存储(NAS)方面发挥了威力。
例如,过去基于纸张或缩微胶片开展业务的一些大型传统行业,在信息数字化后,其数据存储压力扑面而来。对提供横向扩展NAS系统的供货商而言,这些行业正是对他们充满了吸引力的垂直市场,因为他们的产品正好可以为高性能的应用提供支持。
如果我们观察一下“横向扩展NAS的垂直关联行业图”中的IO轴和吞吐量的关系模型,就会发现这些行业有许多应用都要求非常高的吞吐量。在许多横向扩展NAS系统(包括明年将推出的支持并行网络文件系统的NAS系统)中内置的并行数据服务功能提供的能力超过了每秒MB——传统纵向扩展NAS系统提供的能力值。
纵向扩展NAS的垂直关联行业图
就在最近的五年前,这张图还不是这个样子。许多右上方的业务负载还挤在图中的左下侧。但是处理器技术(如多处理器和更快的芯片集),视频、图像和设计软件(例如3-DCAD、4-D医学成像、高清电视等等还有很多)等各方面的进步,已经催生了新的业务负载,而这些负载带来了完全不同的性能需求。这些应用产生了海量的文件和多线程的访问请求,单处理器或双处理器的纵向扩展系统没法及时完成响应,造成了业务系统的响应减慢或请求服务超时。
让我们对一些具体的行业进行深入分析,来佐证我的观点。
金融服务。这些习惯了管理巨量交易信息的用户,现在成了高性能并行文件系统的主力用户。高性能并行文件系统通常是应用在市场业绩预测和商业智能方面。这些应用调用的文件,不只是内容巨大,还需要长时间的密集计算处理,需要高级别的数据保护并需要保证数据的即时可用性。金融服务的用户特意寻找横向扩展架构以消除数据整合的瓶颈。数据整合是金融服务IT的核心任务。对于这些用户来说,理想的NAS解决方案是,可以随时通过增加节点,来使数据的访问性能变得更快。
生命科学。毫不奇怪,从事与健康相关的科学研究组织,对并行文件系统解决方案非常感兴趣,因为这些系统可以提供高带宽的数据传输能力和大规模的可扩展性。在这些组织中,紧密合作是非常必须的。例如,IT团队必须得想办法,使成千上万的研究人员可以共享非常大的基因测序文件或蛋白质组数据。这些企业还必须加快他们的发现过程来获得成功。如果能更快地发明一种新的药物,这种药物就可以被更快地进行测试,就能更快地获得批准,并应用于医疗和科研实践中。对这些组织而言,要加速药物的发现过程,以IT为中心的解决方案就是,构建基于高性能并行文件系统的基础设施,从而避免后续不断进行颠覆性的系统改造和升级。
制造和设计。像已经明确的其他行业一样,高科技制造商、航空航天公司、纳米电子新企业、CAD/CAM设计公司以及其他更多的类似组织,也需要巨大的存储量。他们都在寻找方法来优化数据管理。这些行业用户需要实现存储容量的无缝扩展,以应对数字信息的不断增长,并提高工程团队之间的信息共享能力。在这样的环境中,系统失效会导致重大的经济损失。所以制造和设计领域的用户希望部署基于文件的存储系统,以达到近乎100%的可靠性以及容量在线升级的简易性。他们为增强文件系统管理、数据移动、复制和迁移/分级存储等功能,寻找自动化的解决方案。
媒体和娱乐。传媒和娱乐机构的经营模式已经发生了急剧的变化。在早期的年代里,他们会出版印刷的杂志,现在,这些杂志仅提供“单一网络在线”格式。不仅所有编辑的内容需要迅速提供给读者和编者,所有的广告文件也一样。对数字密集型的媒体和娱乐公司而言,大型视频文件也加剧了数据增长带来的问题。
今天的传媒和娱乐机构创建和保护着TB或PB级的文件数据。在一些企业中,大部分数据是建立在“边缘”——远离主数据中心的远程新闻分社或CGI设计工作室。这些业务机构为数据的复制备份带来了难题,甚至可能会使得基础设施的灾难恢复(DR)能力受到障碍。媒体和娱乐机构正在寻找高性能的横向扩展NAS解决方案来解决各种问题——例如提高虚拟服务器基础设施的性能,或者,为内容的创作者和阅读者提供信息的随时可用性和及时可用性。
石油和天然气。在过去,探寻石油和天然气储量具有很大的不确定性。今天,借助于数字化的信息数据,这已经成了一个高精度的科学过程。过去的十年中,在油层下降和提取操作变得更加复杂的同时,对疑似资源储藏地点的三维可视化,已成为该行业无时不刻需要利用的工具。在石油和天然气垂直市场的IT经理,面临的挑战是找到NAS基础设施,以支持海量数据的共享和保护。这些数据是对石油储量建模/仿真处理的结果。如果没有一个这样的架构,能够在数据存储容量增长的同时保持数据访问的性能,那么保持企业的竞争优势会变得非常困难——主要原因是“见效时间”(资源开采)太长了。对石油和天然气企业处理巨型规模的模拟计算而言,横向扩展NAS系统是一个很好的解决方案。而这样的模拟计算,是他们在竞争中获得成功的直接保证。
传统的高性能计算、学术和研究。在公共部门工作的天体物理学家、分子生物学家、化学家、核物理学家和社会科学家,是海量数据的制造者和使用者。例如,由欧洲核子研究中心运行的大型强子对撞机,其IT团队在2010年中期就管理着70PB的数据。甚至规模非常小的研究设施(通常是运行在经费有限的大学机构或商业实验室)也依赖于高性能网格计算和并行文件系统架构,以支持建模和仿真任务,才能够解决现实世界问题以及为“大”问题做出回答。他们的工作需要低延迟的网络集群,以应对非常高的性能要求和带宽要求。
这些行业是横向扩展系统的先期实际采用者,因为它们在吞吐量性能方面有横向扩展的刚性需求。但大多数的部门应该充分考虑,将许多PB的数据存储在一个单一命名空间,其效率如何以及能节省多少运营费用。这是横向扩展系统在云架构获得应用的原因。这种架构使得类似Gluster这样的公司,从基于云的业务和构建私有云的企业中获得了巨大收益。Gluster推出了一种横向扩展的文件系统,运行在普通硬件上,能够支持块、文件和对象数据。企业战略集团预测,到2015年,所有外置NAS系统收入的80%都将来自于横向扩展系统的交付,而且,“大文件的数据”和云计算将是其增长的核心点。
(本文不涉密)
责任编辑: