AMomo1224

AMomo1224

他的全部讨论

讨论

$浪潮信息(SZ000977)$ 去查了一下文献,拿浪潮信息最先的源2.0(SC)大模型和全球的Al模型做了一下对比,在HumanEval和GSM-8k两项重要指标中,分别位列全球第二、第三,性能略逊于ChatGPT 4.0,远优于ChatGPT 3.5。另外降低了大模型对芯片间P2P带宽的需求,为硬件差异较大训练环境提供了一种高性能...

讨论

$浪潮信息(SZ000977)$ 浪潮信息发布开源千亿级大模型源2.0
浪潮信息发布源2.0基础大模型,2.0模型包含三组参数,分别为1026亿、518亿和21亿,在编程、推理、逻辑等方面展示出了先进的能力。与源1.0相比,源2.0侧重通过模型结构的改进提高精度。(36氪)

讨论

$浪潮信息(SZ000977)$ 华为、浪潮携手发力高端服务器市场