幻方大模型性能媲美GPT4

发布于: 修改于:Android转发:0回复:1喜欢:5

大模型:幻方发布全球最强MoE模型DeepSeek-V2:超低成本,性能媲美GPT4,

继今年1月份开源国内首个MoE模型后,幻方人工智能公司最新推出了第二代MoE模型——DeepSeek-V2。这款新模型不仅参数更多、性能更强,训练成本更低的特点,令其在业界引起广泛关注。 DeepSeek-V2采用了创新的模型架构和训练方法,在多项综合评测中均表现出色,有些指标甚至媲美或超越目前最强的GPT-4模型。同时,它的推理效率和部署成本也大幅优于同类大模型,可谓是性能与成本的完美结合。

DeepSeek-V2拥有2360亿参数,其中每个token210亿个活跃参数,相对较少,但仍然达到了开源模型中顶级的性能,称得上是最强的开源MoE语言模型。
研究团队构建了由8.1T token组成的高质量、多源预训练语料库。与DeepSeek 67B使用的语料库相比,该语料库的数据量特别是中文数据量更大,数据质量更高。
据官网介绍,DeepSeek-V2的中文综合能力(AlignBench)在众多开源模型中最强,超过GPT-4,与GPT-4-Turbo,文心 4.0等闭源模型在评测中处于同一梯队。
其次,DeepSeek-V2英文综合能力(MT-Bench)与最强的开源模型LLaMA3-70B处于同一梯队,超过最强MoE开源模型Mixtral8x22B。

幻方大模型概念股 :

每日互动:幻方二股东,技术负责人是每日互动的联合创始人,存在合作基础。

卓创资讯:幻方作为大型私募,卓创资讯金融语料库。

阳光照明:购买幻方3亿产品,叠加电器出海,外销占比75%。

飞利信:飞利信是目前市场采用MLA机制不多的上市公司。

南威软件:在人工智能方面,基于多头注意力机制和增强特征金字塔方法,掌握了新型的生物认证技术。$每日互动(SZ300766)$ $卓创资讯(SZ301299)$

全部讨论

这个阳光照明和大模型也能扯上关系吗