发布于: 雪球转发:0回复:27喜欢:3
【首个AI高考全卷评测结果发布:最高分303 数学全不及格】《科创板日报》19日讯,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能实验室的书生·浦语2.0排名第三,三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。从结果来看,大模型的语文、英语考试水平普遍不错,但数学都不及格,最高分也只有75分。

精彩讨论

公正的股价小笑容06-19 16:27

语言类学科还能到网上抄一抄,数学不会就是不会,没的抄

与尔同销万股愁106-19 16:24

什么人工智能都是骗子,全靠现有数据喂给他死记硬背,根本有主动拓展学习的能力!

天地忆沙鸥06-19 16:18

这说明Ai还有很大发展空间

抢财猫06-19 17:48

证明了AI是个文科生对么?

割叔夜带刀06-19 16:37

人工智障

全部讨论

语言类学科还能到网上抄一抄,数学不会就是不会,没的抄

什么人工智能都是骗子,全靠现有数据喂给他死记硬背,根本有主动拓展学习的能力!

06-19 16:18

这说明Ai还有很大发展空间

06-19 17:48

证明了AI是个文科生对么?

06-19 16:37

人工智障

06-19 16:39

未来10年理工科人才,不能被人工智能替代

现阶段的AI不过是一场算力游戏,完全没有所谓的智能性,资本炒作的结果。

06-19 16:25

太可悲了。

能数学百分90分以上,那应该可以叫真ai了。

数学低分因为没有相同的题目吧,这玩意感觉目前只能语言类有用,因为语言太丰富了,数学需要罗辑思维,目前的AI应该只是个数据库,里面有的就行,没有就不行。