您现在的位置是:首页 > IT基础架构 > 计算存储 >

Scality CEO:对象存储需要多元化访问方式

2013-08-06 17:13:31作者:来源:

摘要Scality公司最近提高了2200万美元的C系列资金,用于扩建市场营销部和加强科技力量,使Scality Ring软件更容易实施,主要原因是看到了对象存储的广阔前景。...

  对象存储供应商Scality公司最近提高了2200万美元的C系列资金,至此,公司的总投资资金达3500万美元。Scality的CEO Jerome Lecat表示,他计划把新投资的资金用于扩建市场营销部和加强科技力量,使Scality Ring软件更容易实施。Scality选择这批投资的主要原因是看到了对象存储的广阔前景。随着开源OpenStack Swift和EMC公司的ViPR项目的发展,对象存储开始走向公众,许多大型企业开始把对象存储作为处理和适应海量非结构化数据的一个方法。

  这种趋势可能给Scality和其它小型对象存储供应商创造一些市场空间,与此同时,也会造成巨大的竞争。SearchStorage对话Jerome Lecat,探讨了对象存储是如何适应整个市场以及Scality如何保证市场份额的稳步增长。

  对象存储最好的应用是什么呢?

  Jerome Lecat:在实际应用方面,对象存储用于SaaS(存储即服务)或云存储。因为它非常适合图片长廊和一些在线存储需求,比如备份或动态归档、电子邮件服务、基于Hadoop的分析、一些垂直高性能计算(HPC)、健康中心、数据日志收集以及许多行业都存在的规范化的需求。而从技术角度来说,当用户使用传统的SAN或NAS(网络存储技术)方法遇到瓶颈时,也可以考虑使用对象存储解决方案。

  现今有很多对象存储供应商仍然在为获得客户的认可和接受而努力。这是不是因为对象存储技术太超前呢?企业IT部门做这方面的技术转变是否值得?

  Jerome Lecat:目前,采用对象存储技术的限制因素主要在于和对象存储器交互的访问方式。一旦采用这种技术,公司需要有相关的专业技术人员,来开发创建基于提供商提供的API的应用程序接口。而且,用户不能更改商业应用,所以只能坚持使用经典的数据访问方式。而Scality的横向扩展文件系统(SOFS)能为用户提供多种灵活方式,当然除了我们的HTTP/REST API。我们将持续提供多元化的访问方式,现在使用的是NFS,未来几周我们将发布CIFS。

  没有统一的标准接口是导致客户不采用对象存储的主要原因吗?

  Jerome Lecat:很明显,不采用对象存储的主要原因就是访问方式。标准接口成为了关键。目前在对象存储主要的标准中,Amazon S3标准在实际中使用最为广泛;而SNIA(Storage Networking Industry Association)和CDMI(Cloud Data Management Interface)主要作为工业标准。

  一个企业如何确定对象存储是否适合他们呢?

  Jerome Lecat:在销售周期的早期,当我们和客户讨论他们的需求时,我们不会尝试推销对象存储,除非确实很适合客户。我们并不擅长50 TB的云平台,我们也不擅长在基于快照的共享NAS系统上管理一大堆应用程序,毕竟这不是我们公司的核心技术。我的客户群体主要是需要处理大量文件和大量数据的客户。这并不意味着我们不能从小数据做起,我们只是看到了过去几年以来数据的惊人增长率。要知道,对象存储不是适合所有数据的。

  对象存储有可能代替NAS成为非结构化数据存储的首选吗?

  Jerome Lecat:实际上,市场上最大的NAS系统不能超过20 PB。如果超出了怎么办呢?使用多个集群?比如60 PB的系统使用三个20 PB的集群。这会相当复杂,而且会导致成本上升。万一再增加1 PB数据是否还要再增加一个20PB的集群呢?而且四个集群的负载相当不均衡。在这种大数据环境下,对象存储毫无疑问是NAS的另外一个选择,尤其是在他们可以提供文件共享协议的情况下,比如NFS或者CIFS。

  对象存储的设计理念是避免任何限制因素。这是一个横向扩展的无共享设计模式。

  一些供应商把文件系统从对象存储上分层出来,为什么要这样做呢?这不是减少了对象存储的通用性了吗?

  Jerome Lecat:我觉得这样做很好,文件系统的访问方式容易让人们接受,能在市场上创造更多的机会。文件系统不是新东西。但是如果文件系统不能很好的适应分布式架构,很可能带来瓶颈,降低性能,增加响应时间。其实,目前有将HPC、网格计算、Web服务和并行文件和对象存取相结合的趋势。

  一些利用平行、横向扩展对象存储架构和Hadoop集成的平台,看起来似乎很有前景,您怎么看?

  Jerome Lecat:Hadoop有许多特点。Hadoop意味着客户并不同时需要计算集群和存储集群。Scality采用的策略是,客户既可以在Hadoop存储上运行Hadoop任务,也可以在我们的软件(Ring)上运行。我们的软件是部署在经典的x86服务器上。所以我们选择Hadoop任务,把任务运行在存储数据的节点上。Hadoop分布式文件系统有一些限制,很多供应商选择用自己的模块代替这部分。Scality也是如此,我们用支持CDMI的Scality SOFS提供计算的存储位置,避免从数据源尤其是另外一个集群的数据源,解压传输和加载数据。

  对象存储可以使用复制或纠删码(Erasure code)来保护数据,那么,什么时候使用复制更好?什么时候使用纠删码(Erasure code)更好呢?

  Jerome Lecat:这两种数据保护的技术都很好,能提供非常高的持久度。复制方式简单高效,没有数据转化,读取和保存都是针对原数据而言的。数据只是被复制到了集群的另一个位置,因为并行的恢复进程非常高效,恢复数据也非常快。复制方式在针对小数据的对象存储时非常有效。当数据很大时,复制就不是很理想,因为复制大量的数据会消耗大量的时间,而且用于存储备份的硬件开销也非常大,以致整体开销也很大。假如你有一个10 PB的集群,当你使用三路复制时,你需要额外20 PB的集群来存储备份数据。所以,这是一个财政问题而不是技术问题。

  第二种方法是基于纠删码技术,采用这种技术备份数据不会占用很大的空间,但是你需要处理多数据块、校验和或者一些整合数据的公式。所以选择备份数据方法的一个简单原则是:纠删码主要在大规模环境或者大数据集的环境下使用,而复制备份用于小数据集或者小集群。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们