部分国内大模型公司现状

发布于: 修改于:Android转发:0回复:46喜欢:10

到今天为止,国内主流大模型公司里面已经公开发布最新模型使用moe架构模型的,仅minimax、昆仑万维商汤腾讯这四家。其他有moe架构模型的还有几家不知名的,比如阶跃星辰,DeepSeek等,以及开源了小参数moe的阿里。大部分公司的moe模型都是参考的法国AI创企Mistral的开源模型。

国内第一家发布moe架构的公司是minimax,第一个版本是自研,后续6.0和6.5是否自研需要打问号,自行脑补。另外现在好几家称研发了万亿moe的大模型都可以自行脑补,毕竟咱也不是砖家,也不是业内人士,不清楚具体情况。

第二家是昆仑万维,在今年2月6日发布了moe商业版本。大概率是75B的那个小版本,200B板块中号已经开源,最新版本是400B,大概率下一代版本1000B,也就是万亿参数。

第三家是商汤发布的600Bmoe模型。从已知公开信息,性能上无限接近早期版本的GPT4。根据昆仑万维开源的200Bmoe以及商汤600Bmoe的测试性能参数,大概能推算出昆仑万维400Bmoe目前的实际性能介于GPT3.5和GPT4之间。

目前国内还有两家有实力的对手,百度和智谱还没发布moe架构大模型。去年百度和智谱在大模型性能上是领先的存在。但在架构上比较骚气,没有跟随openai,都是走的其他路线,结果就是现在moe架构上已经明显落后。去年11月份百度的新版才转向,跟随的GPT3.5的同架构,智谱更加迟,在1月份的GLM4版本才转向。原本百度4月16日开发者大会是打算公布moe版本的大模型,但最终没公布,李彦宏在开发者大会上说了这么一句意味深长的话,我们在大模型开发上踩了很多坑。从百度和智谱之前版本的性能上来说还是非常强的。因此他们的moe架构大模型虽然还没发布,但还是会有很强竞争力。

对于当红炸子鸡月之暗面只能说推广很强,模型很垃圾,创始人没有用心研发大模型,早期融资就开始套现,浪费了天才的称号,目前为止多模态都去还没有。文本大模型也是部分性能不错,综合性能都没资格上国内大模型牌桌。

其他去年的当中炸子鸡百川智能,只能说是来搞笑的,一开始就是抄llama,当时看着进度很快,现在基本上没声音了,另外一个所谓大模型初创五虎之一的零一万物,去年就丑态不出,抄还不承认,非要说自研,被老外扒掉了底裤。

说到开源,那么阿里不得不提,阿里通义千问走的开源路线(虽然最新版本也是闭源)但底子还是llama爆改以及Mistral的模仿,不过总体性能还不错。

然后腾讯这个万亿moe大模型看看就好,人家很聪明,根本不提自研。

最后还有一个重要玩家,字节跳动。字节在文本大模型上性能不是特别强,但多模态上很可能脱颖而出,另外虽然没有发布moe架构,但应该离发布不远了。在moe技术上,字节是有牛人的。

讲完大模型,接着说下应用

应用简单点概括下,今年是应用元年,超级应用不会出,各家大模型今年都是两条路走路。底座大模型不断升级,应用不断发布。应用国内相互抄袭或者借鉴很明显。比如秘塔搜索就说天工AI搜索在增强和研究模式上抄了它家的,但秘塔你不也炒的海外那家AI搜索么。另外字节的豆包就抄的有点得潦草了,直接接gpt4被抓包,现在天工有个超爱聊天的小华,你搞个超爱聊天的小宁,换个其他名字也行啊。应用目前有唯一性的是天工的AI音乐,目前国内唯一,但据传比较潦草的豆包也即将发布AI音乐产品。

总结就是今年是大模型淘汰元年和应用元年。那些初创今年没拿到融资的都是很容易被淘汰。目前初创也就三家今年有过融资。应用这里还需要多给点包容度,目前很多应用功能都还不完善,还需要后期不断改进。重要的是谁能率先发布流量款应用,获得更多的用户。$昆仑万维(SZ300418)$

精彩讨论

全部讨论

国内讨论大模型没提及讯飞星火啊?

海绵 VS Suno优点人声质量:海绵音乐在人声处理方面表现优异,尤其是在中文歌曲中,减少了电音的使用,提高了吐字清晰度和演唱流畅性。
音乐风格:特定风格(如R&B和DJ风格)上更符合国人的听感。
用户界面:设计简洁、功能排布合理,对新手用户非常友好。

06-07 09:02

还是出来说了啊

06-06 20:49

结论是昆仑路线走对了,且不算落后。为啥没提及讯飞的

风哥讲讲马上解禁的激励股呗

讯飞没给你钱是吧,所以不评论?

06-06 22:12

minimax的语音能力还可以,感觉不输豆包

06-14 16:33

应用元年 结果ai应用板块惨不忍睹

06-06 22:14

这个就叫专业

06-06 21:04

总算正经发回帖子了