发布于: 修改于: 雪球转发:2回复:14喜欢:4
个人认为,我们跟GPT的差距并不是技术差距。尤其是过去十年多模态应用上,我们一点都不落后于国外,要把视频、语音交互加给模型,没有想象那么难。至于模型降本,也不难办。从超长期看,难的是高质量语料的极度欠缺。首先,我们缺少外文语料,除非靠买或者集中人工标注。GPT面向的是全球,我们只面向国内,所以未来大概率捞不着反向出海。第二,我们的中文语料存在极度删减,这个从中文互联网监管现状上就能看出来。第三,即便在已删减的这部分中文内容,也是大量粗制滥造,我们没有海量百科全书式的严肃东西。所以,中文模型最终也就是个生活、娱乐、便民、简单办公居多的工具,为了商业化而商业。它的根本局限体现在社会供给端。
引用:
2024-05-15 07:50
【国泰君安:OpenAI发布GPT-4o AI交互迎来革新】财联社5月15日电,国泰君安研报表示,GPT-4o作为基础性工具为更多创新应用提供了生长土壤。ChatGPT拥有全球最广泛的大模型用户基数,每周有超1亿人使用 ChatGPT,GPT-4o 的文本和图像功能免费推出或将进一步夯实用户基础。我们认为,对图像和视频的...

全部讨论

05-15 08:10

其实语料获取全世界都一样,就是海量抓取,非法的,国内外都有公司专门做。

用来写套路文够用就行了。天天写的材料🐶福音

05-15 09:18

体制限制

05-15 11:32

不论中文还是外文,高质量语料在对世界基本规则的认知和解释层面应该是一致的,可以考虑让AI学习所有预言的语料,在输出内容时再和智能翻译系统结合,或许是解决问题的一个可能路径。

05-15 09:47

1

05-15 09:35

05-15 09:17

融入到世界,利用别人的成果,不需要自己搞一套。

05-15 08:56

看看百度下搜出来的都是什么垃圾玩意。。。。。

05-15 08:54

这样就是最好的
不正是LD们想要的结果嘛

05-15 08:13

国内是搞不出这个东西的