hartmon 的讨论

发布于: 雪球回复:7喜欢:8
算力和数据是最值钱的,算法相关的公开paper有几千篇[大笑]

热门回复

山总不能这么类比,协议是一种行业标准,它必须公开才能达到其目的。
算法当然是商业模式的极为重要部分(例如google的搜索算法,支撑起了Google帝国),但是在AI领域里面,算法目前看并不是最重要的部分:
1. 主要的算法几乎全是公开的,涉及各个领域的各个方面。私有的算法和公开的部分的差距,大概也是80和90分的差距,具备基础素养的AI科学家和工程师,缩短这段差距并不是十分困难;
2. 在既定的算法模式下,算力决定了训练效率,别人1天顶你10天,你就算有好的创意,也没人家推出的快;
3. AI是一种基于概率模型的匹配,它目前还不具有真正的智能,所以,数据的质量决定了AI的能力上限。
因此,以我的理解,做算力的和拥有海量高质量数据的公司(如各大互联网公司/ZF等),才是这轮AI浪潮中的关键角色。

软件跟硬件有个很大的区别,就是如果一个idea被提出来,大概率有牛人就能实现。
最广为人知的例子是大数据技术,当初Google只是发了三篇文章,合计不到100页。Apache基金会主席一个人就捣鼓出了原型,很快风靡全球,成就数万亿的产业。
AI并不是新兴技术,20年前人们就在做自然语言理解了,这个领域的算法和论文,公开的极多极多。你不会遇到像光刻机制造那样的专利门槛、物理技术门槛、先进制程门槛。
所以我说,虽然算法水平有差异,但并不是核心问题,算力和高质量数据才是核心。

互联网的协议都是公开的,paper也多,然后呢?

山行兄的反驳很正确。很多东西不是知道就能做到的。比如光刻机,比如汽车的超级发动机。

他们相互作用:算力的提升也需要通过大数据的分析来优化算法,数据的清洗,质量也很重要。毕竟他们还不能直接读取自然数据,需要预处理。

呃..可是等你实现那个idea的时候…别人已经把市场整个占领了…又只能等国家把人家挡在外…

这是真正懂行的