给turbo2044烧纸 的讨论

发布于: 雪球回复:6喜欢:2
math比claude高,已经很牛了。12项里有八项超过gpt,用对标有什么问题?就你这种人,再好也没用,鸡蛋里你也能挑出骨头来。

热门回复

某汤用的是gpt1106版本,那个版本的math 分数只有61,你但凡要点脸,也不会拿它当借口。说白了,你不就是想说你觉着对标了才算对标?然而从你过往发言就能看出来,你的认知极差,最喜欢不懂装懂。从目前的数据看,讲对标没有任何问题。除非你根本不知道对标这俩字到底什么意思。

零一lmsys评分倒是前十,有个p用?估值不到kimi的二分之一。除了你这种脑子里有bao的,谁会觉着李开复作弊出来的玩意,能存活下去的?你这种认知能力,就别分析这个分析那个了,除了丢人,一点用没有。

要真敢对标,放到LMSYS去打,我绝对认可。这样的对标跟商汤日日新的对标有何区别呢?

按这种对标法,年底全部被零一打趴,包括OPENAI,等着瞧。你的认知更差

哈哈哈哈,精神扭曲,小丑一个。

你的认知实在实在太差,小学生水平,不值一聊。