浅玩了一把商汤大模型

发布于: 修改于: 雪球转发:0回复:6喜欢:9

作为国内人工智能领域的头部玩家,商汤科技近年来在大模型和生成式AI领域频频发力。2023年,其自研的"日日新"大模型总算力规模达到了12,000 petaFLOPS,运营的GPU数量也高达45,000张。凭借"模型即服务"的创新商业模式,商汤让客户能够轻松地微调和调用各类生成式AI能力。得益于技术积累和商业模式创新,2023年商汤的生成式AI业务收入突破11.837亿元,同比大增199.9%,已占到总收入的34.8%。

从财报数据看,2023年商汤实现总收入34.058亿元,毛利润15.008亿元,综合毛利率为44.1%。在战略转型的背景下,传统业务收入有所收缩,但智能汽车等新兴业务保持稳健增长,整体经营效率得到提升。受制于高额研发投入和行业周期波动,商汤2023年的EBITDA和净利润仍为亏损,但经营性现金流和应收账款回款均实现大幅改善,显示出良好的发展潜力。

今年4月,在生成式AI成为全行业热点以及新一代"日日新5.0"大模型展现出强大技术实力的背景下,商汤股价一度暴涨超过40%,周内涨幅接近翻番,刷新了上市以来的最大单周涨幅。多家券商给予了商汤"买入"等积极评级,看好其在AIGC赛道的发展前景。商汤的发布会中发布了面向消费者的"商量"平台和面向开发者的"商汤日日新"平台,以及医疗、数据分析、文生图等行业应用平台。在此背景下,我们从开发者和消费者的角度,对商汤面向不同场景的系列大模型产品进行了体验评测,以寻找问题作为主要目的。

商量平台:

商汤面向消费者的"商量"平台在智能对话、文档问答、多模态交互等方面展现出强大的中文理解和生成能力,但某些功能的局限性也比较明显。

首先,对话模型目前仅支持中文,在代码相关问题上需要切换到专门的模型,这在一定程度上限制了使用场景和灵活性。如果能够在对话模型中无缝集成代码能力,将极大提升用户体验。

其次,使用国外IP访问"商量"平台会遇到连接障碍,无法打开商汤相关域名。这对于海外用户或使用国外网络的用户而言是一个不小的问题。扩大服务器全球部署,提升平台的网络可访问性,将有助于"商量"拓展国际市场。

此外,平台的内容审核策略还过于严格,导致模型经常出现拒绝回答的情况,尤其是在文档问答环节,用户经常遭遇莫名其妙的"敏感词"判定而无法获取有效答案,体验大打折扣。我曾将几个上市公司财报上传给它,均被告知无法问答(商汤自己的财报超过了10MB,不允许上传)。对此,希望能优化审核规则,在合规的前提下最大化模型响应的灵活性,是"商量"团队需要攻克的一个难题。

多模态交互是"商量"平台的一大亮点,对于日常图片的识别效果可参考其他媒体的评测,我这里使用图片生成HTML代码的任务来测试模型的效果,从测试表现来看,模型还不够稳定,生成结果质量参差不齐,往往需要经过多轮对话才能接近预期效果。平台偶尔还会出现无法正常读取图片的bug。这说明图像理解与代码生成的技术还有待进一步打磨,提高模型的鲁棒性和连贯性将是关键。

遗憾的是,"商量"平台暂不支持文本生成图像(Text-to-Image)功能。好在商汤的"日日新"开发平台已经提供了相关模型,填补了这一空白。期待这一功能能够尽快移植到面向消费者的"商量"平台,为用户带来更加丰富多元的交互体验。

总的来说,商汤"商量"平台在通用中文语境下声称的对标GPT-4的表现可以说所言非虚,但在英文支持、代码集成、多模态稳定性、内容安全等细分场景还需持续优化。如果能够针对这些痛点精准发力,提供更加个性化和垂直化的AI助手服务,"商量"平台有望在激烈的AIGC赛道异军突起,赢得更多用户的青睐。

商汤日日新平台:

在面向开发者的"日日新"平台方面,商汤提供了涵盖语言理解、知识检索、数据增强、垂直行业适配等全面的API接口和开发套件。支持函数调用、知识库构建、文件管理、Embedding、模型微调等基本功能,API支持的上下文长度与KIMI相当,但使用体验逊于百度文心一言。

与其他模型不同的是,商汤平台使用模型的不同功能需要调用不同的专用模型,例如函数调用需使用SenseChat-FunctionCall模型。这可以解释商汤推出多个不同功能平台的原因,但对开发者来说,一方面,针对性训练的专用模型在特定任务上往往能取得更好的效果,这对追求极致性能的开发者而言是一大优势。但另一方面,过于独立的模型体系确实可能割裂开发体验,特别是对于中小型开发者,掌握和适配多套模型体系的成本可能高于其带来的收益。

在定价方面,"日日新"的API调用价格与KIMI相仿,低于百度文心一言,性价比较高。官方还贴心地提供了Python SDK,便于开发者快速上手和集成。

不过,目前"日日新"在开发者生态建设和使用体验方面还存在一些不足:

其次,开发者工作台还不够稳定,存在一些bug和访问障碍,特别是在开发者试用环节,经常出现无法打开的问题,影响了用户体验。加强平台的稳定性和可用性,是提升开发者满意度的关键。

再次,平台的API文档在逻辑组织和示例代码方面还有不少提升空间,部分文档甚至缺少Python代码示例,不利于开发者快速理解和应用。完善文档体系,提供更加清晰、全面、接地气的开发指南和示例代码,将极大降低开发者的学习门槛。

最后,在技术支持和服务方面,平台的响应渠道还不够完善,开发者遇到问题时获得及时帮助的途径有限。而对于部分行业模型,需要额外咨询销售才能开通使用权限,而这无疑增加了开发者的时间成本。建立完善的开发者社区和服务体系,提供更加便捷、高效、全面的技术支持,将是打造卓越开发者体验的重要一环。

总的来说,"日日新"平台虽然在API能力和定价上具备竞争力,但在开发者生态建设和服务体验方面还有较大的提升空间。作为一个面向开发者的产品,优秀的文档、工具、社区和服务至关重要。期待商汤能够尽快补齐这些短板,以开发者的需求为中心持续打磨产品,为开发者营造一个更加友好、高效、愉悦的开发环境,释放大模型技术赋能产业应用的巨大潜力。

商汤在大模型领域取得的技术突破有目共睹,但美国将其列入实体清单并持续实施芯片禁运,导致算力瓶颈成为制约其发展的一大难题。在可预见的未来,商汤可能难以像海外科技巨头那样,通过不断扩充算力规模来支撑大模型在消费级应用中的大规模商业化。这意味着"商量"等面向C端用户的平台可能难以复制ChatGPT式的爆发式增长。

不过,商汤在2B领域已经积累了丰富的行业经验和政企客户渠道,尤其是在此前以智慧城市业务为主导的ToG领域。在当前形势下,商汤将生成式AI的主战场从2C转向2B,聚焦垂直行业,为特定领域的政企客户提供定制化的大模型和小模型服务,或许是一个务实的选择。通过深耕行业需求,打造领先的垂直领域AI解决方案,商汤可以在2B市场实现差异化竞争,并借助既有的行业积累实现更高效的商业变现。

政企客户对数据安全和模型定制化的需求天然更高,而这恰恰是商汤的强项所在。在"日日新"平台现有的API和开发套件基础上,进一步增强数据隐私保护,提供更灵活的模型适配和部署选项,并积极拓展行业生态合作,将是商汤打造2B市场影响力的关键抓手。

从这个角度看,尽管在2C领域受到算力掣肘,但商汤在2B领域仍有广阔的发展空间。通过聚焦行业AI应用,加速技术商业化,商汤可以在AIGC浪潮中另辟蹊径,实现差异化发展。这需要商汤在战略资源配置、产品规划、生态建设等方面进行前瞻性布局和动态调整。

当然,2B市场的拓展周期相对较长,对商汤的技术、产品、服务能力也提出了更高的要求。如何平衡通用技术积累与行业需求适配,如何在垂直领域实现快速复制和规模化增长,将是商汤面临的重要课题。

#商汤科技# $商汤-W(00020)$

(本文由Claude3,Chatgpt-4,商量对话大模型5.0共同辅助创作)

全部讨论

04-28 21:12

TO C 的商业模式还未完全成熟,C端的付费意愿太差,全世界一样。商汤在目前暂时不在C端发力是非常正确的,把有限的算力和服务器留给大B端,一可以扭转公司的经营业绩,二可以抢占刚刚开始的商业市场,三是可以在这过程中快速积累更多的行业数据。当国内的算力规模和C端付费场景成熟,再发力也不迟,C端不像B端有很高的粘度,只要你的产品利害,一下C仔就会来到。

04-29 13:10

商汤的文生图叫“秒画”,已经都公开应用了很久了

现在比文心和千问还差的基本没什么戏了