直接给结论吧,gpt4毫无悬念回答正确,国内大模型总体表现强差人意。经提示后,百川表现最好,天工回答并没有完全落在点子上,其余的就只能用莎翁的“如果他会思考,木棍也会思考”来形容了。
本次比试得分表:
CHATGPT :100分
文心一言:0分
360智脑:0分
科大星火:0分
昆仑天工:30分
智谱清言:0分
百川AI:50分
腾讯混元我还在申请,没有测试