潜水员:谈谈对Big Data的思考

发布于: 修改于:雪球转发:8回复:21喜欢:4

 文章来自 @潜水员 原文链接网页链接 


我刚看了下前面有两篇名字变成了思考的片段。那个是笔误,我还是喜欢思考的碎片作为标题。特此更正。

周五和@linan 聊了很多。好像涉及整个internet世界,我们有做很多不错的判断对这些新玩意。这里写一个关于big data的big picture。

话说我一直不是最看好所谓Big Data这个方向,也没太多具体理由就是直觉的不喜欢。

现在想来直觉还是有点理由。

Big Data问题最后推动我做判断的理由还是AMZN的年报。


2005年AMZN的年报。感谢@李妍

第一部分: 要点提炼

* 我们在亚马逊网站做出了许多至关重要的决定,这些决定可以用数据来说明。正如你期望的那样,并非我们所有的重要决策都能用这种令人羡慕的数学方式来解决。有时候我们只有很少或根本没有历史数据来进行指导,我们不可能进行前瞻性实验,对于决策过程来说不切实际。尽管数据、分析和数学模型都能发挥作用,但是在这些决策的主要因素还是判断。
* 以数学为基础的决策需要广泛的共识,而以判断为基础的决策经常引起争议,至少要等到付诸实践才能得到证明。任何不愿意忍受争议的机构,在做出第一类决策时也会限制自己。而在我们看来,这样做不仅会限制争议——也会限制创新和长期价值的创造。

* 定量分析改善了用户体验和我们的成本结构。我们使用现有的物流网络来预计季节购物高峰,为新产能建立数学模型。我们通过观察预期的产品种类,包括产品规格和重量,来决定我们需要多大的仓储空间,我们是否需要设备,来处理单独运送的小尺寸分类产品或大尺寸产品。为了缩短配送时间,减少出库运输成本,我们在接近客户、交通枢纽和现有设施的基础上分析了物流中心的位置。从这三个段落只要用归纳和总结就很容易明白数据在商业上的作用。


我们讨论的结果是:数据是对过去的递归,数据是优化现状的工具,但是数据无法先验,无法预测未来。数据对创新的价值几乎为0。so数据有用,但是数据的价值有限。远不是所谓神器。这是一个供应过剩的时代,这是一个需求稀缺的时代。优化供应无法带来需求。这就限定所谓数据的价值。反过来喜欢数据的人和在证券市场上喜欢quantan的人是差不多一个类型。年轻没商业经验,读书好理科优秀特别是数学,学校精英。


Splunk的上市或许为Big Data提供一个炒作接口。但是接口只是借口。最后会回归的。


全部讨论

2012-04-25 03:49

好玩

2012-04-23 23:05

对于未来,无法准确预测,却有概率大小之分。数据分析或挖掘,探索过去事件发生规律,据此推测未来事件发生概率,如马尔可夫链。如果创新是一种突变或变异,历史对创新确实没用。

2012-04-23 14:58

要想创新,就要不断探索用户需求。数据是基础,当事物能够以数据定论时,这个市场估计也被挖掘的差不多了

我觉得其实不需要过分看高“创新”。这个世界的确需要革新的创新力量,但更多则是利用已有规律发现需求服务需求。比如说早年美国超市有很经典的案例,通过所有销售单据统计,发现啤酒和尿布往往是一个顾客购买,然后就把两者放在一块,提升销量,这个的确没啥创新,但是却给客户方便,给商家销量上升。

2012-04-23 11:33

数据挖掘是计算机科学中很重要的分支,利用大量数据确实可以总结规律,不能说没意义。单单库存管理这一项都利用了多少数据挖掘啊!再比如搜索引擎匹配内容的广告显示,也需要大量数据挖掘;以前面指的亚马逊,它对商品评论的数据挖掘也是很深的。

2012-04-23 11:00

直觉能带来需求,预见未来,但破产是个数字问题,得靠现金流的数字预测来预防。

2012-04-23 10:58

数据可以帮你在细节上赢得未来。假如上帝创造了两个乔布斯,一个有big data相助,一个没有,在创造iphone的赛跑中,前者的成功概率得以从50%提高到70%,你说这个助手该估值多少钱。当然,如果big data到了庸才手里,等于你把青釭剑送给夏侯恩。

2012-04-23 10:58

:)

2012-04-23 09:40

data有局限。

2012-04-23 09:33

但是数据能够分析和优化需求,让供给和需求更有效率的对接。除了创新,任何名词都可以说是价值有限的,但创新不也需要落实在这一个个名词上吗