商汤日日新5.0重磅推出,长文本+多模态趋势驱动算力需求

发布于: 雪球转发:0回复:0喜欢:2

【华福电子】商汤日日新5.0重磅推出,长文本+多模态趋势驱动算力需求$寒武纪-U(SH688256)$

商汤4月23日推出日日新SenseNova 5.0大模型体系,基于超过10TB tokens训练,综合能力“全面对标GPT-4 Turbo" 长文本+多模态趋势确认,AI推理算力需求如火如荼 【长文本】趋势确认,AI推理侧标配200K。日日新5.0推理时上下文窗口可以有效到200K左右,Kimi为20万字(约250K),Claude3为200K,GPT-4 Turbo为128K 日日新5.0新增【多模态】交互能力,支持高清长图解析和理解以及文生图交互式生成 参数量持续爆发,Al训练持续支撑算力芯片出货 Al训练对算力芯片需求驱动力不减。此次5.0大模型达到6000亿参数,据澎湃新闻,训练一个千亿参数的模型大约需要10830个英伟达A100GPU。若线性外推,以H100 GPU训练6000亿参数大模型,大约需要18940个H100 GPU 持续看好国产算力芯片渗透。2023年报显示,商汤大模型基础设施大装置SenseCore总算力规模突破性增长至12000 petaFLOPS,运营GPU数量达4.5万卡,其中国产算力2000P,国产化率约17% AI大模型加速竞赛,Al训练侧算力需求层出不穷 ·上周(4.18)Meta推出最强开源LLaMA-3大模型,基于15T个token,含8B和70B两个版本,另有400B+参数版本持续训练中 此前(3.19)OpenAI CEO对外披露GPT-5性能改进幅度或超预期,一系列重要产品亟待发布 产业链相关公司: -CPU/GPU:寒武纪 海光信息 -服务器:工业富联 -PCB:沪电股份胜宏科技 -铜链接 沃尔核材 精达股份等 华福电子:徐巡/谢文嘉/李雅文