部分国内大模型公司现状到今天为止，国内主流大模型公司里面已经公开发布最新模型使用moe架构模型的，仅minimax、昆仑万维、商汤， ...

到今天为止，国内主流大模型公司里面已经公开发布最新模型使用moe架构模型的，仅minimax、昆仑万维、商汤，腾讯这四家。其他有moe架构模型的还有几家不知名的，比如阶跃星辰，DeepSeek等，以及开源了小参数moe的阿里。大部分公司的moe模型都是参考的法国AI创企Mistral的开源模型。

国内第一家发布moe架构的公司是minimax，第一个版本是自研，后续6.0和6.5是否自研需要打问号，自行脑补。另外现在好几家称研发了万亿moe的大模型都可以自行脑补，毕竟咱也不是砖家，也不是业内人士，不清楚具体情况。

第二家是昆仑万维，在今年2月6日发布了moe商业版本。大概率是75B的那个小版本，200B板块中号已经开源，最新版本是400B，大概率下一代版本1000B，也就是万亿参数。

第三家是商汤发布的600Bmoe模型。从已知公开信息，性能上无限接近早期版本的GPT4。根据昆仑万维开源的200Bmoe以及商汤600Bmoe的测试性能参数，大概能推算出昆仑万维400Bmoe目前的实际性能介于GPT3.5和GPT4之间。

目前国内还有两家有实力的对手，百度和智谱还没发布moe架构大模型。去年百度和智谱在大模型性能上是领先的存在。但在架构上比较骚气，没有跟随openai，都是走的其他路线，结果就是现在moe架构上已经明显落后。去年11月份百度的新版才转向，跟随的GPT3.5的同架构，智谱更加迟，在1月份的GLM4版本才转向。原本百度4月16日开发者大会是打算公布moe版本的大模型，但最终没公布，李彦宏在开发者大会上说了这么一句意味深长的话，我们在大模型开发上踩了很多坑。从百度和智谱之前版本的性能上来说还是非常强的。因此他们的moe架构大模型虽然还没发布，但还是会有很强竞争力。

对于当红炸子鸡月之暗面只能说推广很强，模型很垃圾，创始人没有用心研发大模型，早期融资就开始套现，浪费了天才的称号，目前为止多模态都去还没有。文本大模型也是部分性能不错，综合性能都没资格上国内大模型牌桌。

其他去年的当中炸子鸡百川智能，只能说是来搞笑的，一开始就是抄llama，当时看着进度很快，现在基本上没声音了，另外一个所谓大模型初创五虎之一的零一万物，去年就丑态不出，抄还不承认，非要说自研，被老外扒掉了底裤。

说到开源，那么阿里不得不提，阿里通义千问走的开源路线（虽然最新版本也是闭源）但底子还是llama爆改以及Mistral的模仿，不过总体性能还不错。

然后腾讯这个万亿moe大模型看看就好，人家很聪明，根本不提自研。

最后还有一个重要玩家，字节跳动。字节在文本大模型上性能不是特别强，但多模态上很可能脱颖而出，另外虽然没有发布moe架构，但应该离发布不远了。在moe技术上，字节是有牛人的。

讲完大模型，接着说下应用

应用简单点概括下，今年是应用元年，超级应用不会出，各家大模型今年都是两条路走路。底座大模型不断升级，应用不断发布。应用国内相互抄袭或者借鉴很明显。比如秘塔搜索就说天工AI搜索在增强和研究模式上抄了它家的，但秘塔你不也炒的海外那家AI搜索么。另外字节的豆包就抄的有点得潦草了，直接接gpt4被抓包，现在天工有个超爱聊天的小华，你搞个超爱聊天的小宁，换个其他名字也行啊。应用目前有唯一性的是天工的AI音乐，目前国内唯一，但据传比较潦草的豆包也即将发布AI音乐产品。

总结就是今年是大模型淘汰元年和应用元年。那些初创今年没拿到融资的都是很容易被淘汰。目前初创也就三家今年有过融资。应用这里还需要多给点包容度，目前很多应用功能都还不完善，还需要后期不断改进。重要的是谁能率先发布流量款应用，获得更多的用户。$昆仑万维(SZ300418)$

部分国内大模型公司现状

作者：天行健爱美女

精彩讨论

全部讨论