发布于: 雪球转发:2回复:6喜欢:6

6月13日,2024阿里巴巴全球数学竞赛(简称“阿里数赛”)公布决赛名单,801人成功晋级,AI队伍未能达到决赛入围分数线,无缘最终角逐。

记者从达摩院方面了解到,统计显示,在全球知名高校院所与企业的563支报名队伍中,参赛AI队伍的平均分已达到人类选手平均水平,但离数学高手仍有较大差距。AI最高分仅为34分,无缘决赛。

据介绍,AI成绩不佳,核心还是由于基础模型的数学能力有限。虽然在面对解答题和证明题时,AI可以通过知识检索等方式拿到基础分,但一旦涉及后续的深入分析,AI就开始出现“知识幻觉”。尤其在面临选择题时,多数AI出现了“蒙题”现象。阿里数赛组委会成员、达摩院决策智能实验室负责人印卧涛表示:“数学是人类智慧的皇冠,AI挑战赛是一项积极尝试,有助于我们持续突破AI的能力上限,带来更多可能。”

全部讨论

我认为,阻碍AI应用落地的最大障碍,不是AI笨,而是AI有自作聪明的的情况。一个再蠢的人工智能,只要它边界清晰,有自知之明。
它也能找到落地场景。但如果搞不清自己的情况,不懂的时候,不是输出不懂,而是瞎猜。那能胜任的工作就太少了,给门口做个保安,都无法合格。所以,AI大模型,最先落地聊天(吹牛)也是因为这个。

06-22 13:45

/