幻方大模型性能媲美GPT4 大模型：幻方发布全球最强MoE模型DeepSeek-V2：超低成本，性能媲美GPT4，继今年1月份开源国内首个MoE模型...

大模型：幻方发布全球最强MoE模型DeepSeek-V2：超低成本，性能媲美GPT4，

继今年1月份开源国内首个MoE模型后，幻方人工智能公司最新推出了第二代MoE模型——DeepSeek-V2。这款新模型不仅参数更多、性能更强，训练成本更低的特点，令其在业界引起广泛关注。 DeepSeek-V2采用了创新的模型架构和训练方法,在多项综合评测中均表现出色,有些指标甚至媲美或超越目前最强的GPT-4模型。同时,它的推理效率和部署成本也大幅优于同类大模型,可谓是性能与成本的完美结合。

DeepSeek-V2拥有2360亿参数，其中每个token210亿个活跃参数，相对较少，但仍然达到了开源模型中顶级的性能，称得上是最强的开源MoE语言模型。
研究团队构建了由8.1T token组成的高质量、多源预训练语料库。与DeepSeek 67B使用的语料库相比，该语料库的数据量特别是中文数据量更大，数据质量更高。
据官网介绍，DeepSeek-V2的中文综合能力（AlignBench）在众多开源模型中最强，超过GPT-4，与GPT-4-Turbo，文心 4.0等闭源模型在评测中处于同一梯队。
其次，DeepSeek-V2英文综合能力（MT-Bench）与最强的开源模型LLaMA3-70B处于同一梯队，超过最强MoE开源模型Mixtral8x22B。

幻方大模型概念股：

每日互动：幻方二股东，技术负责人是每日互动的联合创始人，存在合作基础。

卓创资讯：幻方作为大型私募，卓创资讯金融语料库。

阳光照明：购买幻方3亿产品，叠加电器出海，外销占比75%。

飞利信：飞利信是目前市场采用MLA机制不多的上市公司。

南威软件：在人工智能方面，基于多头注意力机制和增强特征金字塔方法，掌握了新型的生物认证技术。$每日互动(SZ300766)$ $卓创资讯(SZ301299)$

幻方大模型性能媲美GPT4

作者：淡泊捉妖记

全部讨论