不再靠流量打法，大模型时代巨头洗牌作者|谢涵编辑|陈秋运营|陈小妍另镜(ID:DMS-012)目前，AI大模型虽然还处于早期发展阶段，但国内外科技企业都已...

作者|谢涵

编辑|陈秋

运营|陈小妍

另镜(ID:DMS-012)

目前，AI大模型虽然还处于早期发展阶段，但国内外科技企业都已有深深的危机感。AI大模型不仅在颠覆互联网的流量入口，更重要的是开启新一轮生产力变革，也将是重塑下一个时代超级APP的核心技术。

在发布首个视频生成模型Sora震惊外界后，OpenAI时隔三月又放出大动作，近期发布了最新的GPT-4o。可横跨语音、文本和视觉，并且可以感知人类情绪，可随时被用户的指令打断，根据指令提供更丰富语音语调或不同风格。

与以往不同的是，OpenAI此次并未把新的旗舰大模型聚焦在参数上，而是更多在产品的体验上和场景的应用中，从目前行业发展来看，如果说过去一年，AI大模型是爆火出圈的一年，那么2024年，将是AI大模型落地实际场景应用和推动产业变革的一年。

与此同时，国内外头部科技企业公司面对GPT-4o的诞生，再次加速开启新一轮竞赛。谷歌发布了Project Astra和Veo，直接对标目前OpenAI领先的GPT-4o与Sora。

微软发布以AI为核心能力的Copilot+PC，选用最新的高通X Elite芯片，并改变交互模型，最重要的是搭载的AI模块真正实现本地化大模型，直接影响了通用大模型的商业价值，成本也直接成为商业化的衡量因素。

值得注意的是，近日国内科技公司字节跳动、阿里、百度、腾讯、科大讯飞都先后加入了价格战，以寻求更多的商业化机会，但另镜认为，不同于互联网红利时期，AI大模型技术创新和差异化场景落地能力才是激活AI大模型市场活力的关键因素。

在AI大模型技术的快速迭代下，国内哪一家企业有机会抢得先机？

5月29日，在发布“日日新SenseNova 5.0”大模型仅5周后，商汤在香港举办发布会，正式发布“商量”粤语版本，API输入及输出价格均为30港元/百万Token（词符）。商汤还宣布，自2024年7月1日起，“商量”粤语网页版及应用程序（APP）将永久免费向粤语区用户开放使用。

自去年4月首次发布“日日新SenseNova”大模型以来，商汤已推出5个版本，其综合能力全面对标GPT-4 Turbo。

商汤“日日新SenseNova 5.0”为何会快速做到技术领先，核心的技术壁垒是什么？目前行业还处于早期发展阶段，商汤大模型真正的优势有哪些，又面临哪些挑战？

大模型快速迭代，会为行业带来什么？

Distinct Mirror

商汤和OpenAI成长路线十分相似，公司发展都是靠技术沉淀。2020年对于商汤来说是非常关键的一年，技术路线或战略定位稍有误判，都有可能在下一个路口掉队。这一年的夏天，商汤启动在上海临港区建设人工智能计算中心（AIDC）。

2022年1月24日，商汤AIDC正式运营，成为亚洲最大的人工智能计算中心。目前，商汤大装置总算力规模在超过4.5万块GPU的加持下，达到12000 petaFlOPS。

2023年，生成式AI业务成为商汤的核心板块业务，这也是商汤一次重要的战略抉择。商汤生成式AI业务营收也迎来了高增长。3月26日，商汤发布2023年财报，生成式AI业务营收12 亿元，同比大增199.9%，占营收比重 35%。

就在上个月，商汤发布日日新SenseNova5.0，采用混合专家架构（MoE），参数量高达6000亿，支持200K的上下文窗口。性能全面对标GPT-4 Turbo。次日，商汤港股仅一上午暴涨31.15%，股价更是连续7个交易日上涨。

长期被低估的商汤，为何被市场看好？对此，有分析认为商汤核心竞争力是其大模型能力的飞跃、提供全套AI落地。但另镜认为，本质是日日新SenseNova大模型发布节奏超预期，商汤AI大模型技术能力，不仅赋能行业以及终端应用突破，更重要的是在企业层面，对于AI大模型的训练和场景落地产生了实实在在的效果，获得了客户的认可。

商汤大模型坚持的技术路线是，在尺度定律的指导下，持续探索大模型能力的KRE三层架构（知识-推理-执行），不断突破大模型能力边界，重心放在解决数据质量的瓶颈。

此次日日新5.0大模型能力显著提升，其背后是训练数据的全面升级与训练方法的有效提升，以及商汤AI大装置SenseCore算力设施与算法设计的联合调优。算力设施架构和模型算法协同定义，这也是商汤大装置联合迭代的核心能力。

5月21日，国内权威大模型测评机构SuperCLUE最新榜单出炉，从4月的评测结果来看，商汤日日新5.0(SenseChat V5)的中文基准测评结果排名第一。以总分80.03分的成绩刷新国内最好成绩，并且在中文综合成绩上超越GPT-4-Turbo-0125，这是国内大模型首次在SuperCLUE中文基准测试中超越GPT-4 Turbo实现登顶。

从SuperCLUE此次榜单测评结果来看，日日新5.0大模型在文科类中文任务上好于国外大模型，各项能力表现较为均衡；在长文本、生成创作、角色扮演、安全能力、工具使用上处于全球领先位置，适用于智能体、内容创作、长程对话等应用场景。

AI大模型加速行业新对决

Distinct Mirror

5月22日凌晨，微软举办Build 2024大会，一口气发布60种新产品和解决方案，且一切都与AI有关，重头戏就是Copilot和模型生态。GPT-4o现可在Azure AI Studio中使用，也可作为API使用。

这一切被外界解读为微软等来了与苹果再次反击的机会。微软开发的AI小语言模型（SLMs）Phi-3系列也发布了一款新的——Phi-3-vision，并已可在Azure中使用。

而当我们打开手机，平时手机里最常用的聊天软件、办公软件、出行软件、拍照功能等各类应用，也都在发生很大变化。各大应用软件都在打造行业专属Copilot，满足用户多样需要，而大模型对于各大应用最大的改变就是催生了很多新的功能。

端侧大模型已经成为大模型重要落地场景，简单的Copilot功能可以帮忙查阅邮箱，记录通话信息，并协助提炼通话内容，管理会议议程。

大模型发展已经进入2.0阶段，无论是系统软件，还是手机、PC以及汽车终端，在AI大模型的不断加持下，各行各业的头部企业重新展开真正意义上的对决。

在过去一年多，小米与商汤有着非常深度的AI大模型落地场景的合作，小米汽车在端侧大模型需求非常强，需要在无网、弱网场景下给用户同时提供比较好的体验，而这正好是商汤技术深耕的强项。

不仅如此，在AI大模型加持下，小米的语音助手对话和服务能力大幅度提升，产品非常难增加的活跃用户次日留存增加10%，检索不常见问题满足率也由20%多提升到80%多。

OpenAI最新的GPT-4o，最让外界震撼的就是根据指令提供更丰富语音语调或不同风格。

而在国内，阅文正在与商汤拟人大模型合作，创建了名为“筑梦岛”的AI原生虚拟社交生态平台，当前整个窗口长度32K，已能记住上百人对话，随着用户和角色的聊天越来越深入，整体聊天体验也会持续优化。

据悉，商汤日日新·商量-拟人大模型高级版本（SenseChat-Character-Pro），在面向中文角色扮演对话代理（RPCAs）领域的CharacterEval测评中超越GPT-4位列第一、达到SOTA，核心维度全面领先。

目前商汤大模型技术场景落地，不仅赋能科技和影视等企业产品创新，还在传统的煤矿行业、监管高的金融行业，以及医疗、电网巡检、城市管理等多领域展开了深度合作。

大模型发展还在摸索期，有诸多不确定性

Distinct Mirror

在日日新SenseNova5.0发布会上，商汤现场演示了《街头霸王》游戏PK，绿人是由大模型GPT-4操纵。红人是由商汤轻量版端侧大模型——SenseChat Lite操纵。

结果显示，在端侧，小模型更具优势，可以快速出击，打得大模型无力还击。端侧轻量级模型场景落地，也在一定程度上影响了通用大模型的商业前景，成本也成为商业化的衡量因素。

硅谷VC张璐表示，开源模型的快速发展，为初创企业和大企业提供了另一种选择，也能更高效地优化能耗和基础设施成本。初创企业可以调动最前沿大模型的API，在上面配套使用开源模型，再自己做些修改进行模型调优。

AI大模型的全面竞争，正在从单一的文生文，拓展到文生图、图生图、文生视频、图生视频等多模态能力。

我们看一组商汤「秒画文生图」大模型5.0版本图片，另镜测试的提示词是一个女孩从面无表情、到真实人像、再到绽放笑容和再笑一点。

测试过程，会发现「秒画」的优点是对于提示词理解和生成的图片非常快，最重要的是能快速读懂提示词的连贯性，文生图的效果已经具备很好的实用性。

根据不同的提示词，「秒画」可以不断微调，用户在图片创作、海报设计、游戏出图等多场景中都可以利用文生图增加创作灵感、节省时间和人力成本。

值得注意的是，GPT-4o增强了3D视觉内容生产能力，2023年3月，商汤也在AppleStore上线了格物3D新应用，3D视觉内容生产能力，有更好的训练推理能力，也能更好地理解空间事物，会是AI生态构建及应用落地进程中重要的AI大模型创新技术。

近日，商汤科技董事长兼CEO徐立在受邀论坛发表主旨演讲中指出，在中国做AI大模型开发有一个很重要的优势，就是可以与非常多的产业化数据相结合。AI大模型能力提升，依赖于针对行业场景进行差异化的高质量数据要素的构造。

AI教父杰夫里·辛顿教授在近日的视频采访中表示，AI大模型的发展真正的关键是数据规模和计算的规模，大语言模型正在寻找共同的结构，然后编码任务，那么效率也会得到更大的提升。他认为，GPT-4参数越大，会更有创造力，它会比人类更有创造力。

目前国内的大模型行业仍处于初步阶段，由于前期算力基础设施需要大量资金投入，未来通用大模型领域可能会向头部厂商集中，更多厂商需要向垂类大模型转型，垂类大模型以及端侧大模型将是未来主战场。

而当AI大模型真正落地企业场景，就会发现技术积累非常重要，很多棘手问题并没有太多时间去解决，当前AI大模型并不是一味追求大参数，而是要能为企业提供高质量数据、与实际落地场景相匹配和拥有解决问题的能力。

不再靠流量打法，大模型时代巨头洗牌

作者：另镜