$昆仑万维(SZ300418)$ Kimi后看到的AI又一重大突破: 幻方AI正式发布新一代开源模型，模型成本骤降下重申...

发布于:2024-05-10 07:19

雪球

转发：0

回复：3

喜欢：2

Kimi后看到的AI又一重大突破: 幻方AI正式发布新一代开源模型，模型成本骤降下重申看好AI应用商业闭环【天风计算机缪欣君团队】

#幻方AI发布了开源的MOE模型DeepSeek-V2
幻方在5月6日发布了新一代大模型DeepSeek-V2，模型为总计236B参数的MOE模型，约21B激活，在训练阶段模型本身使用了8.1万亿tokens进行训练。模型在架构上持续创新，采用了创新的MLA架构（注意力机制中相较于传统的MHA，能够显著降低内存占用），叠加MOE结构中的创新，使得推理成本显著下降，目前模型已经开源
#模型效果优异但成本低到极致
在目前大模型主流榜单中，DeepSeek-V2均表现出色:中文综合能力（AlignBench）开源模型中最强；英文综合能力（MT-Bench）与最强的开源模型LLaMA3-70B同处第一梯队，超过最强MoE开源模型Mixtral 8x22B，模型支持128k上下文。在测评得分上，MMLU得分77.8分，整体超过GPT3.5接近GPT4，与最新的LLaMA3 70B接近。同时推理的价格非常低，输入100万tokens成本仅1元，输出2元，约等于GPT-4的百分之一，相较月之暗面24元的也大幅降低
#大模型成本有望下降带动应用增长
大模型在2024年逐步走向小型化、低成本化和接近GPT4水平，海外开源模型已经形成了四分天下的局面，国内也迎来了超低成本的大模型方案，成本是诸多应用的瓶颈之一，而幻方AI大模型的发布也有望大幅降幅大模型应用门槛

全部讨论

tigerccz

05-10 08:51

幻方又可以收割了

阳光zlx

05-10 08:41

二流水平

星际大冒险

05-10 08:24

作者：半缘君hl

全部讨论