腾讯大模型进展及投资线条挖掘

发布于: 修改于:雪球转发:25回复:33喜欢:54

周五盘后已经可以确认腾讯将于下周一举行“行业大模型及只能应用技术峰会“,作为国内互联网TOP1,腾讯拥有顶级的流量入口和生态,必然不会错过这场AI的盛宴。

1. 腾讯大模型的进展

1)首先在单模态NLP领域,其实水平已经还可以,至少不比国内的差,比如和科大讯飞百度阿里相应的模型进行基准测试,表现都可以持平或得分略高。但目前的基本测试主要是基于中文的单模态测试,学界也没有出来更严格意义上的新的评价机制,所以目前表现还可以。

其实国内都浪费了很多时间,现在几乎都在同样的时间节点进行追赶,所以如果数据质量没有本质的差距,应该区别不会特别大。但在多模态领域,可能百度看起来是要好一点,因为百度已经推出了多模态的服务,腾讯具体的推出时间还没把握。

2)在落地策略方面,会先推出2B模式给开发者,先把生态基础做好,鹅厂其实最怕的在生态位上掉队,在B端大模型的生态做成熟后再开放给C端。

其实toC如果开放给公众,能达到比较好的宣传效果,但腾讯一直比较稳健经营,属于不是特别赶进度的公司,经济上可能并不划算。所以先给开发者,先把生态基础做好,这个思路其实和华为比较相似。

3)腾讯做大模型的目标

在模型结构设计上,第一阶段目标是万亿参数,第一步迈的比较大。但万亿参数的模型训练需要非常巨大的数据,数据量的准备最终对模型结果的影响都是非常大。参数上国内玩家入口肯定会从大参数入手,比较担心因为神经元不够而导致能力不够,从研发的角度一定是想高参数发展,未来在高参数模型表现较好的情况下,会考虑通过模型蒸馏的方式做一些相对小的模型。

其次是目前不具备GPT4多语言多模态的能力,混元大模型可能只是在某些分支上表现的还可以。

如果看和OPENAI的差距,认为主要差距主要是数据准备上,起步晚,中文本身数据质量不如英文,但混元模型的技术特点在国内的竞争中是不落后的,因为在数据仓库、数据的整理和分层、参数量、包含算力都在国内第一梯队。

4)相关人员配置:

聚全公司之力做,没有大型的赛马机制,但是在研发的过程中可能有不同的小组,分别负责不同的方向分支,后续看哪个方向分支能走得出来。整体上模型研发人员50人左右,模型基建300人左右(太极平台)。

5)国内玩家和Open Al在算力和算法能力上的差距

Open Al在硬件军备竞赛中彻底领先,微软Azure至少有十万级满载GPU的设备为其服务做加特,一台设备成本在2-3w美金,估计下来100亿美金成本左右,根据会计做下滩销,符合媒体每年20-30亿美金的成本估计。其次底层系统和算法计算层,微软和Google会领先,但是这种是云计算领域,目前方向比较明确的领先部分可弥补。

2. 腾讯大模型投资线条挖掘

1)算力

腾讯与海外大厂差距最大的地方无疑在数据和算力,我个人是认为代码能力腾讯不弱,这周我分享了最近所有英伟达产业链(AI服务器、光模块、PCB等)龙头公司的指引,从他们的口径上看,腾讯买的N卡数量非常有限。

我是认为现阶段没有必要贬低国产算力了,大模型目前仅仅在初级阶段,未来仍旧会有数不清的训练,更何况推理。只要蛋糕在,国内厂商一定会想办法突破,不去期待什么超越英伟达,至少在缩小差距的维度,是可以展望的,要明白,AI的行情发展到现在,市值上隐含弹性最大,业绩上隐含弹性最大的,都是国内AI芯片。未来腾讯在C端要落地大模型,每年的资本开支至少需要上百亿,如果没有国内的供应商,BBAT靠什么去支撑大模型的生态。

腾讯寒武纪等国内大厂都有展开合作(测试阶段居多),国产算力卡的算力和能耗参数其实还好,主要还是生态的问题比较大。本质是代码层面的问题,这一点通过努力优化,差距正在缩小。

从目前了解到的情况来看,腾讯在国产算力供应商方面的开拓,比许多人预期的快不少。

2)应用侧

腾讯的生态自不用说,流量入口和乘数都是国内顶级。

最近一直在说TMT这一轮是流动性因子驱动的牛市,所以别太较真,泡沫最大的风险是踏空。

腾讯的入口生态包括众多领域,找每个领域“含鹅量“高、最好还没法按计算器的公司。

世纪华通:第二大股东就是鹅厂,公司投资的腾讯长三角人工智能超算中心(腾讯云订单,长三角规模最大IDC)及深圳5G大数据中心(华为云订单,深圳规模最大IDC),分别部署40000个和12000个机柜。通过与利通电子成立项目公司,首期1000张H800(鹅),算力4000P,规划5000张,总算力20000P。

这里着重说一下,前几天我提到一个思路,算力中心本质也是新基建,一颗芯片从卖出去到上云再到B端,对GDP的拉动乘数要远大于消费和汽车,接下来其实值得期待众多配套的刺激ZC,目前还仅仅在交易上海算力中心和南部算力节点,后续发散的空间不小,各个省会城市也许都会有。

东华软件:之前已经发过公告,与腾讯云计算签署深化战略合作协议,下周一发布会多半会现身,主要应用层面在医疗、金融领域,东华无疑是腾讯B端生态的重要合作伙伴。

其他还有很多公司,我直接按含鹅量(腾讯参股)+生态进行排序,注意,这个排序和看好与否没有任何关联性,单纯为了方便看,具体谁好,要根据该领域AIGC的实际进展进行决策(其中部分或许有出入,欢迎修改补充):

博思软件 14.97%,金融

泛微网络 4.89%,企业服务软件

天融信1.94%,网安

长亮科技1.14%,银行IT

常山北明0.54%,智慧城市

华宇软件:智慧法务

精彩讨论

自己的路1682023-06-16 19:02

周总
世纪华通:第二大股东就是鹅厂,公司投资的腾讯长三角人工智能超算中心(腾讯云订单,长三角规模最大IDC)及深圳5G大数据中心(华为云订单,深圳规模最大IDC),分别部署40000个和12000个机柜。通过与利通电子成立项目公司,首期1000张H800(鹅),算力4000P,规划5000张,总算力20000P。$世纪华通(SZ002602)$ $利通电子(SH603629)$ $昆仑万维(SZ300418)$

赤脚方正2023-06-16 18:47

腾讯NLP怎么少得了拓尔思

做好每天的真正正确2023-06-16 19:27

腾讯的图片模型,可以说全球第一了,作者可以去试试,腾讯智影,目前非常多从业人员在使用,图片可以直接商业应用。

全部讨论

2023-06-16 19:02

周总
世纪华通:第二大股东就是鹅厂,公司投资的腾讯长三角人工智能超算中心(腾讯云订单,长三角规模最大IDC)及深圳5G大数据中心(华为云订单,深圳规模最大IDC),分别部署40000个和12000个机柜。通过与利通电子成立项目公司,首期1000张H800(鹅),算力4000P,规划5000张,总算力20000P。$世纪华通(SZ002602)$ $利通电子(SH603629)$ $昆仑万维(SZ300418)$

2023-06-16 18:47

腾讯NLP怎么少得了拓尔思

腾讯的图片模型,可以说全球第一了,作者可以去试试,腾讯智影,目前非常多从业人员在使用,图片可以直接商业应用。

2023-06-17 08:50

东华软件,低位,正宗,图形不错

2023-06-16 19:02

东华软件

2023-06-16 19:29

中芯国际是国产算力吗

2023-06-18 11:12

腾讯混元大模型

2023-06-18 08:07

还有弘信电子

2023-06-17 10:24

//补充):
博思软件: 14.97%,金融
泛微网络: 4.89%,企业服务软件
天融信:1.94%,网安
长亮科技:1.14%,银行IT
常山北明:0.54%,智慧城市
华宇软件:智慧法务

2023-06-17 10:01

周五盘后已经可以确认腾讯将于下周一举行“行业大模型及只能应用技术峰会“,作为国内互联网TOP1,腾讯拥有顶级的流量入口和生态,必然不会错过这场AI的盛宴。
关注腾讯概念股:朗玛信息(300288)参股公司动视云获腾讯投资增资入股