继续关注AI应用起量和多模态技术演进

发布于: 雪球转发:0回复:0喜欢:1

阶跃星辰Step系列大模型发布,国内大模型独角兽公司持续推进模型能力进步。3月23日,阶跃星辰发布Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版。同时,效率工具跃问和AI开放世界平台冒泡鸭已全面开放。

此外,国内5家大模型独角兽公司也在不断推进大模型能力发展,包括智谱AI、百川智能、月之暗面、零一万物、MiniMax。我们认为,国内外各大厂商持续推进大模型能力发展,AI产业趋势进一步明确。

关注AI应用起量和多模态技术演进两条主线

1)大语言模型看国内应用落地的场景。海外基于先进的GPU算力、较高的人才密度,具备不断刷新大模型基础能力边界的比较优势;而中国在互联网时代孕育出的多样应用场景有望为AI应用提供丰富入口。并且,出于高额资本投入和商业化之间的平衡,回归C端用户需求的应用有望成为AI下一阶段发展的重点。

国内C端应用有望基于提升个人效率和提供情绪价值实现发展。Kimi Chat在C端表现亮眼,同时我们认为未来大模型需要与具体场景进一步结合,才能实现价值的深度释放。

1)提升个人效率(长文本能力):国产大语言模型在长文本领域实现突破,如Kimi Chat。

未来C端应用落地需要与细分场景进一步结合,如阅读场景(中文在线掌阅科技)、影视剧本创作场景(华策影视)、金融场景(财联社与阶跃星辰合作开发金融大模型)等。

2)提供情绪价值(连续对话能力):在情感陪伴场景中,海外Character.AI自上线以来,收获上亿用户在官网定制自己的AI;国内盛天网络与聆心智能合作,探索AI游戏社交“情感对话大模型”。在游戏场景中,巨人网络在推理派对手游《太空杀》中推出AI推理小剧场玩法。

3)多模态看海外技术的迭代。文生视频方面,目前多模态技术仍存在多模态数据融合等问题,技术路径尚未收敛,未来仍存在较多技术进步的潜力和可能性。

我们认为,关注3个核心时长节点:1)从4秒到15秒:利好短视频和营销。当前文生视频长度大多覆盖3-18秒,已可满足短视频需求,短视频领域有望迎来制作革新。同时,对于有制作海量短视频素材诉求的营销公司,多模态技术有望赋能素材制作。建议关注:因赛集团引力传媒蓝色光标

2)从15秒到2小时:利好长视频。一方面影视制作流程有望实现优化;另一方面IP有望借助AI工具升维为视频内容。建议关注:华策影视捷成股份中广天择奥飞娱乐

3)从2小时到实时生成:利好直播和游戏。实时视频生成或将极大改变游戏创作设计和交互方式。建议关注:巨人网络掌趣科技三七互娱恺英网络吉比特电魂网络

文生音频方面:Suno V3发布,爆款音频出圈。3月22日,AI初创公司Suno AI推出音乐生成模型V3,只需几秒即可生成2分钟音频,提升音频制作效率。建议关注:昆仑万维盛天网络

核心观点

我们认为,在国内外AI产业趋势进一步明确的背景下,国内AI应用在C端取得突破,海外多模态技术路径仍存在较多进步潜力和可能性。

建议关注两条主线:1)大语言模型看国内应用落地的场景:基于长文本能力:阅读场景下的中文在线掌阅科技;影视创作场景下的华策影视;基于连续对话能力:情感陪伴场景下的盛天网络;游戏场景下的巨人网络

2)多模态看海外技术的迭代:文生视频方面:短视频和营销场景下的因赛集团引力传媒蓝色光标;电影影视场景下的华策影视捷成股份中广天择奥飞娱乐;游戏场景下的巨人网络掌趣科技三七互娱恺英网络吉比特电魂网络;文生音频方面:昆仑万维盛天网络

风险提示 AI技术发展不及预期的风险、政策监管风险、行业竞争加剧的风险。【来自太平洋证券】