发布于: 修改于:Android转发:0回复:2喜欢:0
回复@iFly2023: 某汤用的是gpt1106版本,那个版本的math 分数只有61,你但凡要点脸,也不会拿它当借口。说白了,你不就是想说你觉着对标了才算对标?然而从你过往发言就能看出来,你的认知极差,最喜欢不懂装懂。从目前的数据看,讲对标没有任何问题。除非你根本不知道对标这俩字到底什么意思。//@iFly2023:回复@给turbo2044烧纸:要真敢对标,放到LMSYS去打,我绝对认可。这样的对标跟商汤日日新的对标有何区别呢?
引用:
2024-06-28 14:17
$科大讯飞(SZ002230)$
说实话,这次讯飞没有真正对标上GPT 4 Turbo,代码能力、多模态能力自己承认还不行,MATH评分也差很多。相信8月份的这次升级会好很多,到时代码、多模态能力会上来,数学和逻辑推理相信还能上来一些。

全部讨论

06-28 22:35

按这种对标法,年底全部被零一打趴,包括OPENAI,等着瞧。你的认知更差