您现在的位置是:首页 > IT基础架构 > 计算存储 >
大数据工具开发缓慢
摘要“发现人们的异常行为事实上很容易,”他说。“我们的系统几乎可以实时做到这一点,这样的速度远超市场上现有系统。”...
总部位于西雅图的Context Relevant公司的CEO和联合创始人Stephen Purpura说,今时今日的数据科学家所使用的开发工具仍是“中世纪”的,这是新兴公司希望解决的问题。
Context Relevant提供内部部署的对于Splunk的大数据搜索和监控,包括点击预测与分析的数据托管分析软件,它的应用可以运行在Hadoop和其他的MapReduce引擎之上。
Context Relevant是个年轻的团队,但其管理团队有丰富的大数据管理经验。例如,该公司的工程副总裁Jim Walsh主持开发的宇宙分布式数据存储和分析环境,是包括Bing在内的微软众多服务的基础。
“我们专注于预测分析应用程序,因为我们的团队主要由机器学习专家组成”。Purpura说,“这是我们可以增进的价值”。
当然,Context Relevant并非预测分析软件的唯一供应商,而且新兴公司需要面对强大的竞争对手,如Opera、Palantir,以及像IBM和SAP这样的科技巨头。
我们具有1000个节点大的Hadoop集群可以运行在任何一台笔记本电脑,Purpura说。
Context Relevant如何在这样一个红海形成自己的差异化竞争力?
“我们的机器学习应用采取横向自主配置数据”。 Purpura说,“而不像我们的竞争对手那样采用‘垂直’的应用”。
客户可以使用Context Relevant的源代码快速构建大数据应用。
库上运行的Hadoop的源代码非常精巧,通常是一个Python代码,很便于理解。Purpura说。
对于单一客户,Context Relevant预测分析技术为基础的应用,能够使开发时间从几个月缩短为几天,Purpura声称。
“即便那些数据科学的外行也能轻松地找到对他们有价值的数据,他们可以凭一点仅有的数据认知,产生类似风格但却更适合他们需求的新应用”。
欺诈检测是Context Relevant看好的另一个领域。
“一旦你有能力扫描大量的数据,你就有了足够的基础去做关于人们选择倾向的研究。”
“发现人们的异常行为事实上很容易,”他说。“我们的系统几乎可以实时做到这一点,这样的速度远超市场上现有系统。”
Context Relevant在分析领域经验尚浅,但他已经给客户带来回报。Purpura说。Context Relevant迄今为止最知名的客户是Concur,一家旅行和费用管理提供商,它使用Context Relevant的相关产品帮助人们检查发现异常支出和减少开支。
Purpura说更多大型企业用户尚未同意公布其名单,但他补充,:“即将签订更多客户。”
“客户花一大笔钱购买一个创业11个月的公司的产品是很罕见的”。他补充,“现在的市场需求很紧迫。”
(本文不涉密)
责任编辑:
下一篇:大数据工具开发缓慢