这种以软件作为产品的毛利都高,它主要的成本在研发上,没有体现在毛利上,所以谈毛利没用。就好比医药不谈提成谈毛利一样。所以跟茅台对比毛利的水分不一样
最近,阿里领投了国内的AI初创公司MiniMax,投资额高达6亿美元,这是自去年生成式AI的浪潮以来,阿里对国内独角兽的又一次出手。
这家公司专注于多模态AI领域,2022年还曾获得过明势资本和米哈游的投资。
各路资本对其如此青睐,本质看好的还是多模态AI赛道,随着技术不断突破,其行业未来已经越发清晰。
多模态AI将人工智能推向新的高度
相比单模态,多模态向通用人工智能(AG)迈前一步。
多模态AI是一种结合了多种感知信息来源的人工智能技术,利用视觉、语音、文本等多种数据模态进行信息处理和分析,从而提高模型的理解和预测能力。
多模态指的是多种模态的信息,包括文本、图像、视频、音频等,相比于纯语言模型有了更多的训练数据,解决了单模型数据来源相对有限的缺点。
多模态AI的核心优势在于其数据融合能力,能将不同来源和格式的数据集成到单一的分析框架中,例如,它可以同时解析视觉图像中的对象与自然语言处理(NLP)技术解读的文本信息,为决策提供更为完善的依据。
目前,多模态大模型发展路径逐步清晰,主要有三种:
1)利用单模态模型如LLMs来调动其他数据类型的功能模块完成多模态任务,典型代表有Visual、ChatGPT、文心一言等。
2)直接利用图像和文本信息训练得到多模态大模型,典型代表有KOSMOS-1等。
3)将LLMs与跨模态编码器等有机结合,融合LLMs的推理检索能力和编码器的多模态信息整合能力,典型代表有Flamingo、BLP2等。
现在最领先的大模型仍旧是ChatGPT,2024年1月,OpenAI首席执行官奥特曼在与比尔·盖茨的对话中以及参加达沃斯论坛时频繁提及新一代大模型GPT-5。
据奥特曼介绍,GPT-5相比GPT-4实现全面升级,如果GPT-4目前解决了人类任务的10%,GPT-5应该是15%或者20%。
多模态大模型的意义及市场规模
多模态大模型可以综合处理各种信息,学习能力更加强大,更加接近人类的处理问题的方式,这才是真正意义上的人工智能,这让很多应用才有了现实意义。
比如人形机器人领域
多模态大模型可以为人形机器人提供更丰富的感知能力。传统的人形机器人主要依赖于单一的感知方式,如视觉或听觉,而多模态大模型则能够整合并处理来自不同模态的信息,如图像、语音、文本等。
这使得人形机器人能够更全面地理解并响应人类的需求和指令,从而提高其交互能力和智能水平,使其商业化落地速度大大加快,市场规模迅猛增长。
数据显示,尽管人形机器人处于起步阶段,但参照其他电子产品渗透率超过20%后将爆发式增长。2023—2030年,按年均复合增长率30%测算,预计到2030年,我国人形机器人市场规模有望达约8700亿元。
除此之外,在自动驾驶、军工、航空航天等领域,多模态大模型都能够引起划时代的变革。
这些行业智能化水平的不断提高,催化大模型的市场需求不断走强,大模型的市场规模也迎来快速增长。
2020—2023三年间,国内大模型市场增长10倍,2024年预计达到216亿元,同比增长47%。
在大模型方面,国内百度、阿里、华为、腾讯等大厂也是纷纷跟进,推出了自己的大模型产品,竞争非常激烈,各地相关部门也都开始频频出政策进行产业扶持和激励。
多模态AI的产业链如何,有哪些投资机会?
产业链涵盖了从数据收集、处理到模型训练、应用落地的各个环节,其上下游产业链结构复杂且相互依存。下面将对多模态AI产业链的上中下游及A股公司进行分析。
上游产业链主要包括数据收集、处理以及基础硬件设备的供应。数据是AI模型的“粮食”,多模态AI需要大量的文本、图像、音频等数据进行训练。
A股中,有芯片相关的海天瑞声,寒武纪,服务器方面的中科曙光,拓维信息,光模块方面的联特科技,中际旭创。
因此,数据收集和处理公司在这一环节发挥着重要作用。此外,基础硬件设备如芯片、服务器、光模块等也是多模态AI产业链上游的关键组成部分,这些设备为AI模型的训练和推理提供强大的算力支持。
中游产业链主要涉及多模态AI模型的训练和优化。这一环节需要强大的算法团队和计算资源,以实现对多模态数据的深度融合和高效处理。
中游产业链的公司通常具有丰富的AI技术积累和研发实力,能够开发出高效、稳定的多模态AI模型,为下游应用提供强大的技术支持。
在A股上市的公司中主要有科大讯飞,万兴科技等,今天我们重点看一下万兴科技。
目前,万兴科技主要有视频创意、绘图创意、文档创意、实用工具四大业务。2022年在公司营收中的占比分别为63%、19.7%、8.4%、8.4%。
2023年10月29日,万兴科技AI视频创作软件Wondershare Filmora 13全球重磅发布。
WondershareFilmora 13内置创作助手Copilot,用户通过与AI助手对话可快速获取信息辅助创作,甚至可使用Copilot提供的一键助力功能,快速完成剪辑创作。
此外,WondershareFilmora 13还重磅上线了AI文本成片、AI音乐生成器等AI生成功能,以及AI文字快剪、智能人声分离、AI智能遮罩等AI智能编辑功能,从内容生成、音视频剪辑到交互方式迎来多元AI化。
这使得万兴科技一跃成为国内多模态AI的领军企业。
公司的一大优势是毛利率,2018年至今,公司综合毛利率稳定在 95%左右,比茅台还要高。
不过万兴科技的期间费用也比较高,2023前三季度公司销售费用率为49.9%,主要是广告及宣传费较高。
下游产业链主要包括多模态AI技术在各个行业的应用和落地。随着多模态AI技术的不断发展,其应用场景也在不断扩大,涵盖了医疗、教育、金融、安防等多个领域。
下游产业链的公司通过将多模态AI技术应用到具体场景中,实现了对行业的智能化升级和改造。
关注飞鲸投研(id:Feijingtouyan),立即领取最有价值的《成长20:2024年最具有成长潜力的20家公司》投资报告!
来源:飞鲸投研