近期,上海交通大学联合清华大学及爱丁堡大学共同构造了适用于大语言模型的多层次多学科中文评估套件“C-Eval”,并被认作为目前最主流且认可度最高的中文预训练评估任务。在该项目组最新公布的中文大模型能力排行榜上,360智脑大模型的千亿参数版本“360GPT-S2”平均分得分超过GPT-4,尤其在社会科学及人文科学两项上表现优异。
笑死了 你去360智脑让他写点东西 画点图看看不就行了吗?自己不会试吗?差距一下就看出来了……那个文章写的,图画的你好意思直接用?
鬼才信呢