AI中文大模型12月测评排行

发布于: 修改于: 雪球转发:0回复:11喜欢:8

去年火热的“百模大战”到底怎么样了?SuperCLUE日前发布了中文大模型的12月测评结果:

好消息是国内外的差距在缩小,11月的差距还在10分左右,现在是4分左右

测试基于四大维度:

模型象限:

大模型能力分布:

报告全文在此,感兴趣可以仔细研读。看过全文,认为测评基本上称得上科学、客观;如有专业人士,也欢迎发表高见。

在这个榜单中,文言一心4.0API位居国产第一。因为一直用的讯飞星火,这次下载了文言一心、开了个59.9元的会员版(免费版只有3.5版本),准备试用一下。很诧异星火的排名,以前一直用得比较顺手,个人粗略感觉排个前三或者前五应该问题不大。不知各位使用对比的体验如何?报告中的历史排名也部分印证了我的感觉:

不知道还有没有其他类似的专业排名供参考,可以综合比较一下。“百模大战” 估计今年该要决出胜负了,拭目以待吧。

$科大讯飞(SZ002230)$ #AI智能谁称王# #人工智能# #AIGC概念# $百度(BIDU)$

全部讨论

哪个测试靠谱?到㡳

360那个垃圾也在星火之上?

01-08 07:10

吹这么凶的星火,得分这么低。缺卡吧

01-08 20:41

星火好像是进步速度越来越慢了,估计是算力跟不上吧。

01-08 17:54

别以为套个马甲就不认识你

01-08 17:51

讯飞大模型是克的吧!

01-08 11:44

你让他们分别画一张和尚试试就知道了,讯飞一步也没往前走。虽然这只是个玩笑啊,但也有点参考吧。