这两天被一条新闻刷屏，就是极客公园做的一个测试，找了九个大模型（GPT-4o、字节豆包、文心 4.0、百小应、通义千问、...

发布于:2024-06-26 14:08

雪球

转发：0

回复：4

喜欢：1

这两天被一条新闻刷屏，就是极客公园做的一个测试，找了九个大模型（GPT-4o、字节豆包、文心 4.0、百小应、通义千问、Kimi、腾讯元宝、MiniMax）测试 2024 年高考试卷，结果有四个大模型文科成绩上了一本线，整体表现最强的是 GPT-4o（文科 562 分），国内模型中表现最好的是字节的豆包（文科 542.5）。相比文科，AI 大模型们理科最高仅 478.5 分，且数学测试全部不及格，最高分仅 70。

全部讨论

工业化流程

06-26 14:15

大模型只是归纳总结，理科显然是在理解的层面上做到举一反三、见叶知秋。

qyc2004

06-26 22:26

现在的Al也不过如此，相当于全互联网找答案的开卷考试，也就这点分，吹过份了

上升陀螺

06-26 14:15

数学大模型需要满分的马老师去训练优化

作者：游资小马甲

全部讨论