中国当前大模型格局拙谈 “中国现在能够做到跟GPT4-Turbo，能够真实的对标，而不是吹牛的，只有极少数玩家，也就那么两三家。在这中间科大讯...

“中国现在能够做到跟GPT4-Turbo，能够真实的对标，而不是吹牛的，只有极少数玩家，也就那么两三家。在这中间科大讯飞的潜力是最大的。因为什么，因为它们都有上万张卡的国外算力训练在去年一年。我们是真的是小米加步枪，到10月份以后才有点冲锋枪，我们干成这样的水平。他们的潜力我认为已经非常有限，而我们就像一个刚刚茁壮成长的青少年，正在开始长身体，正在开始学知识，我们潜力无限。所以今年上半年，一定可以达到我们的目标，会走得越来越好，越来越快。”

这种说法本人在对星火V3的失望之后，通过理智思考做出过这种猜测，但也怕是自己高看了讯飞。后面被很讯飞多头反复提并强化过。但这句话由刘庆峰本人说出来，还是非常震憾的。如果去年讯飞的大模型发布过程是这样解释的，那新的一年讯飞的潜力真的非常大，毕竟V3到V3.5的迭代是很让人惊喜的。

个人认为，刘庆峰口中的两三家有点夸张了。不过可以做一个推测，他的两三家中肯定有一家是智谱，另外一家可能会是moonshot。这是我的一些理由，不一定对：

1、百度水平暂时可能是最高的，但是是通过大参数和大算力实现的。在如此高的人才密度和算力配置下最近没有进步，并且百度中文权重过高，就是属于无潜力可挖掘这种了。2、百川3也是号称逼近GPT4。不过从王小川之前的表态，“搜索团队做大模型有优势”，“国内大模型相比OPENAI有两年差距”来看。王小川是没有信心真正与OPENAI对标的。目前的水平可能体现了搜索基础的红利，通用大模型可能难以有超过百度的表现。
3、至于阿里、字节、腾讯等大厂，算力足够，其中阿里和字节大模型水平还不错，但由于缺乏积累，后面需要深度挖掘大模型水平时很有可能会掉队，可能也是刘庆峰口中的潜力不大的团队。
4、minimax团队出自商汤，特别是商汤吹得很响，但影响力都比较小。minimax号称研发了万亿参数MOE模型，自己试用下来水平一般。小团队专注做通用基础模型，若没有明显的技术优势很难出来的。
5、剩下moonshot和零一万物，是万众期待的选手。moonshot集合了中国在国外愿意回国发展的最顶尖的团队，据说是中国人才密度最高的团队了，目前的大模型效果也还不错。只不过大模型API前几天才发布，刘庆峰未必看得上，其口中的两三家未必有moonshot。零一万物大模型还在训练中，从其采用Lamma代码训练来看，团队配合还在早期。看点在于李开复的眼界和号召力，并且其口号是做世界NO.1。

刘庆峰毕竟是业内人士，并且其有底气6月份达到GPT4 Turbo水平，敢这么说出口相信也不是空穴来风。这样的说话广告效应绝对拉满，和李开复的世界NO.1一样，如果能兑现，收获将是巨大的，但如果撑不住，将会反噬。

我们可以看看，2024年大模型的竞争是不是讯飞+智谱+其它一家的竞争，敬请期待。

$科大讯飞(SZ002230)$ $百度集团-SW(09888)$

中国当前大模型格局拙谈

作者：iFly2023

全部讨论