发布于: 雪球转发:0回复:4喜欢:1

这两天被一条新闻刷屏,就是极客公园做的一个测试,找了九个大模型(GPT-4o、字节豆包、文心 4.0、百小应、通义千问、Kimi、腾讯元宝、MiniMax)测试 2024 年高考试卷,结果有四个大模型文科成绩上了一本线,整体表现最强的是 GPT-4o(文科 562 分),国内模型中表现最好的是字节的豆包(文科 542.5)。相比文科,AI 大模型们理科最高仅 478.5 分,且数学测试全部不及格,最高分仅 70。

全部讨论

06-26 14:15

大模型只是归纳总结,理科显然是在理解的层面上做到举一反三、见叶知秋。

06-26 22:26

现在的Al也不过如此,相当于全互联网找答案的开卷考试,也就这点分,吹过份了

06-26 14:15

数学大模型需要满分的马老师去训练优化