七论科大讯飞

发布于: Android转发:9回复:24喜欢:22


1、为何“听懂你的话”是如此重要--通过“预测下一个单词”带来的技术革命
不论你认为大语言模型的回答是否恰当,是否在一本正经的胡说八道,你可能都无法否认一个事实,就是大模型“能听懂你的话”。
“听懂你的话”有多重要呢,重要到可以改变你与这个世界的交互方式,人类与互联网的交互方式是字符匹配,与软件、硬件的交互方式是按钮,与其他人类的交互方式是说彼此能听的懂的同一种语言。而大语言模型的出现彻底改变了这一切。你与这个世界的交互可能将主要通过大语言模型实现了。
这是一场任何人都无法视而不见的技术革命,这场技术革命的底层基础就是通过“预测下一个单词”实现的,人工智能发展了五六十年,底层逻辑一直就是“做预测,然后与正确答案做对比,然后微调模型”,依次循环往复。这里的做预测,做对比,做微调都是些并不复杂的算法问题,真正复杂的是“正确答案”在哪里,过去很多时候要靠人工标注正确答案,比如标注这张图片是个“猫”,那张图片是个“狗”,这张图片里有“汽车”,那张图片里有“行人”……这种方法,成本高,效率低。而OpenAI的工程师们,通过把文本中的下一个单词,作为“正确答案”,来训练模型,以极低的成本,对模型进行了海量的训练,最终实现了对人类知识、语言的“数字化”,引发了这场技术革命。
2、资源的诅咒--互联网巨头没有看起来那么强
一旦一个国家(或者地区)发现丰富的资源以后,他就很难再发展工业和科技了,这被称之为资源的诅咒。石油是资源,烟草是资源,茅台是资源,垄断的互联网平台又何尝不是资源。现在,大多数人还是不理解又有钱,又有人才,又有流量,又有品牌的互联网巨头们做的硬件为什么全都失败了。多年以后,他们可能同样无法理解这些巨头做的AI产品为什么又全都失败了。
3、二十年的先发优势--科大讯飞对行业的理解
最近好多人都在发比尔盖茨发言与科大讯飞六年前发言的对比,为什么比尔盖茨现在意识到的问题,科大讯飞六年前就预判了,就是因为讯飞做语音语义二十四年了,该走的路都已经走了,还踩的坑也都踩了,说两个简单的点。
4、为什么讯飞如此重视政府关系,因为语音语义行业发展的核心资源、场景基本都在政府手里,并且必然是一个强监管、特许经营的行业。这个行业核心限制因素既不是算力,也不是算法,而是数据。但这种数据并不是互联网公司那种“M国吓尿了”"亲,包邮哦"的垃圾数据,更不是各种隐私,保密数据,设想一下,你问了大模型一个问题,他回答的是某人在聊天中透露的隐私信息,这会是什么后果。这里能用的数据,只能是公开的,教育、医疗、金融……等领域的数据,而这些数据主要都在政府手里。
5、为什么讯飞专注于教育、医疗、办公……这些场景,因为这些场景就是讯飞几十年经营下来,发现对语音语义产品真正有需求,真正愿意付费的行业。
这样的例子还有很多,这就是早做了二十年的价值。
6、成本--一直被忽视的大语言模型核心竞争力,很多人习惯性的把大语言模型当做互联网产品看待,互联网产品是不用看成本的,一个app的开发和运维成本,在整个商业模型中是可以完全忽略不计的。但大语言模型更像硬件产品,商业成败更决定于成本而非性能。现在有人说星火也没有比竞品回答准确多少啊,甚至取笑讯飞模型参数只有80亿,而竞争对手基本千亿起步,电商龙头甚至都到了万亿。他们完全没搞明白,性能差不多,甚至略好一些的情况下,参数规模低两个数量级意味着什么。参数少两个数量级,成本低的可能就不止两个数量级了,参照OpenAI的数据,竞品们几千亿甚至万亿参数的模型,要是像讯飞一样免费敞开给全国人民(现在开始给全世界人民了)下载,使用,家大业大的互联网巨头可能也要烧破产了
7、最后说一句,美团的王兴,这个人鬼的很,他是做互联网的,但在新能源浪潮中,宁德时代曾老板的几个段子都出自他之手,也压中了理想,可见眼光之精准,对比一下其他互联网巨头,则几乎毫无建树。在大语言模型方面,他的选择也同样值得玩味。

精彩讨论

全部讨论

2023-06-23 00:31

有意思的思考

2023-06-22 22:19

不错

2023-06-22 22:15

星火性能还不如免费的chat GPT吧 未来的收费点在哪里呀?