中国当前大模型格局拙谈

发布于: 修改于:雪球转发:0回复:14喜欢:8

“中国现在能够做到跟GPT4-Turbo,能够真实的对标,而不是吹牛的,只有极少数玩家,也就那么两三家。在这中间科大讯飞的潜力是最大的。因为什么,因为它们都有上万张卡的国外算力训练在去年一年。我们是真的是小米加步枪,到10月份以后才有点冲锋枪,我们干成这样的水平。他们的潜力我认为已经非常有限,而我们就像一个刚刚茁壮成长的青少年,正在开始长身体,正在开始学知识,我们潜力无限。所以今年上半年,一定可以达到我们的目标,会走得越来越好,越来越快。”

这种说法本人在对星火V3的失望之后,通过理智思考做出过这种猜测,但也怕是自己高看了讯飞。后面被很讯飞多头反复提并强化过。但这句话由刘庆峰本人说出来,还是非常震憾的。如果去年讯飞的大模型发布过程是这样解释的,那新的一年讯飞的潜力真的非常大,毕竟V3到V3.5的迭代是很让人惊喜的。

个人认为,刘庆峰口中的两三家有点夸张了。不过可以做一个推测,他的两三家中肯定有一家是智谱,另外一家可能会是moonshot。这是我的一些理由,不一定对:

1、百度水平暂时可能是最高的,但是是通过大参数和大算力实现的。在如此高的人才密度和算力配置下最近没有进步,并且百度中文权重过高,就是属于无潜力可挖掘这种了。2、百川3也是号称逼近GPT4。不过从王小川之前的表态,“搜索团队做大模型有优势”,“国内大模型相比OPENAI有两年差距”来看。王小川是没有信心真正与OPENAI对标的。目前的水平可能体现了搜索基础的红利,通用大模型可能难以有超过百度的表现。
3、至于阿里、字节、腾讯等大厂,算力足够,其中阿里和字节大模型水平还不错,但由于缺乏积累,后面需要深度挖掘大模型水平时很有可能会掉队,可能也是刘庆峰口中的潜力不大的团队。
4、minimax团队出自商汤,特别是商汤吹得很响,但影响力都比较小。minimax号称研发了万亿参数MOE模型,自己试用下来水平一般。小团队专注做通用基础模型,若没有明显的技术优势很难出来的。
5、剩下moonshot和零一万物,是万众期待的选手。moonshot集合了中国在国外愿意回国发展的最顶尖的团队,据说是中国人才密度最高的团队了,目前的大模型效果也还不错。只不过大模型API前几天才发布,刘庆峰未必看得上,其口中的两三家未必有moonshot。零一万物大模型还在训练中,从其采用Lamma代码训练来看,团队配合还在早期。看点在于李开复的眼界和号召力,并且其口号是做世界NO.1。

刘庆峰毕竟是业内人士,并且其有底气6月份达到GPT4 Turbo水平,敢这么说出口相信也不是空穴来风。这样的说话广告效应绝对拉满,和李开复的世界NO.1一样,如果能兑现,收获将是巨大的,但如果撑不住,将会反噬。

我们可以看看,2024年大模型的竞争是不是讯飞+智谱+其它一家的竞争,敬请期待。

$科大讯飞(SZ002230)$ $百度集团-SW(09888)$

全部讨论

大模型竞争最后就是比拼企业的资源,人才资源当然是重要资源,但刘庆峰淡化了另外一个种很重要的资源:资金,这两种资源可以说缺一不可,所以传统互联网大厂必有一席之地,百度同时具备成熟团队和充沛现金流应该值得看好,字节跳动在以后的视频AI时代会有很大优势,反而是智谱,月之暗面这类AI新秀虽然有优秀团队,但几乎没有主营业务收入,完全靠一级市场股权融资,后续资金投入烈度几何级上升,缺乏造血能力基本难以为继,优秀团队也恐被大厂挖走,而科大讯飞则是靠政府鼎力支持,后续的算力投资恐怕很大程度需要安徽省政府帮忙解决才能跟上节奏,所以我认为未来C端可能的胜出者大概会是百度和字节跳动,讯飞则很可能在B端和G端占据大部分市场。

02-08 15:01

智谱怎么没说呢?

02-10 23:00

讯飞这么多C端产品,先能支撑住自用就行
华为的麒麟,鸿蒙也都是在自家硬件上逐步成熟的

02-08 20:42

简单点说,国内大模型格局就是星火和其他

02-08 16:23

minimax千亿吧,国内23年的卡和时间应该撑不起万亿