您现在的位置是:首页 > IT基础架构 > 计算存储 >

大数据的缺陷

2013-03-04 10:06:34作者:黄河来源:

摘要如果要找出中国科技界和时尚界的共同特点,那么可能是,两者都对流行的概念着迷,但热度可能只有两三年。 ...

  如果要找出中国科技界和时尚界的共同特点,那么可能是,两者都对流行的概念着迷,但热度可能只有两三年。

  比如时尚界时下流行的是复古风格,衣着打扮开始往宽松方向走,而一两年前还是紧身衣受欢迎。在科技界,如同一阵风一样流行的有020、C2C、C2B、NFC等等,而现在最新流行的概念则是大数据(bigdata)。

  大数据本身并非新鲜事物,上世纪90年代IBM进行计算机翻译项目的时候,大数据的雏形就已经出现。当时IBM把300多万条英文会议资料信息进行处理,然后让机器以此为基础进行翻译。虽然结果并不佳,但算是对一定规模的数据进行处理、分析和判断的开始。

  现在真正的大数据是指,在海量的数据基础上,用各种算法进行预测分析,从而科学地得出结论,给出指引。而且数据规模越大,算法越科学,得出的结论和预测更准确。尤其是移动互联网的兴起,通过手机和其他移动设备可以随时收集和分析数据,很容易汇集海量的规模,从而形成正向循环。

  在《大数据时代——生活、工作与思维的大变革》一书中,列举了很多大数据制胜的案例。比如美国的物流公司UPS通过监测全美6万辆车的各种数据发现,能提前预测车辆哪些零件需要更换,而之前没有用大数据手段,只能等汽车抛锚或出现问题时,才能去更换零件。从中UPS节省了数百万美元的支出。

  再如一家创业公司,通过分析过去十年美国航班的飞行情况,再结合实时的天气、空港各种数据,能预测出很多航班是否正点。这些预测甚至比航空公司自己给出的航班排期表都准确,从而节省了乘客的时间。

  这样的情况还有很多,善于利用大数据的公司名单还包括:谷歌、亚马逊、IBM、苹果、Facebook等。它们都认为大数据的核心竞争力在于预测,能比对手更精准地知道下一步——这的确是大数据的魅力所在。

  如果仔细考虑不难发现,大数据概念的兴起,实际是科技逻辑一贯的思路在起作用——即在西方的科技逻辑体系中,人是可以被物化的,通过一系列外在的、标签式的符号,能对人进行规定。进而通过一系列外在的科技化语言和数据,能找出规律,找出趋势和发展方向,从而对人的下一步行为进行判断。

  这样的逻辑并无错误,而且在很大程度上的确能起到效果。事实上通过大数据对用户或者消费者各种行为进行的判断预测,成功率也非常高。

  但会不会也有例外呢?一定会有。

  按照大数据的逻辑,预测的发生一定是在精密的数字化的分析上。如果数字化分析依托对象是有规律的物体,则可能问题不大。但是如果是对用户或消费者进行行为、购买的分析,则可能会有一些陷阱。

  举个例子,比如亚马逊通过网页浏览习惯、购买经历、下单情况等知道了A顾客的消费习惯,并能分析出A顾客可能对数码产品感兴趣,于是在相关页面推荐了数码产品。但最终A顾客并没有购买,而是买了一个洋娃娃。这个消费行为从来没有出现在数据积累中,也许亚马逊会认为是自己数据出错了。但实际上,这次购物只是A顾客一时冲动,或者想起了旧事,或者只是偶然看见就想买——这完全是基于人本身一时的情绪而做出的购买决定。用更加通俗的话来说,人有可预知的部分,也有不可预知的部分。前者属于理性,可以交给大数据,后者属于感性,无法用数字衡量。如果想通过大数据全部还原和分析人本身,进而作为商业发展的判断依据,大有可为,但并非是万能解决方案。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们