发布于: 雪球转发:0回复:27喜欢:3
【首个AI高考全卷评测结果发布:最高分303 数学全不及格】《科创板日报》19日讯,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能实验室的书生·浦语2.0排名第三,三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。从结果来看,大模型的语文、英语考试水平普遍不错,但数学都不及格,最高分也只有75分。

全部讨论

06-19 20:53

通用人工智能更是任重道远了,起码要十几年以上

06-19 17:58

要是AI会解数学题,我们全部等着被AI奴役吧

考英语的意义在哪里

06-19 17:14

稍微调一调,喂一喂分数就能大比例提升,只是没有意义罢了

AI没有创造力,基础学科人才不可能被替代。

06-19 16:44

皇帝新装

06-19 16:30

不卖课 不卖广告的ai……

06-19 16:27

Ai写文章还行,让它进行复杂逻辑计算,未来几十年看能不能实现

06-19 16:26

盘古大模型遥遥领先