值得一提的是,大语言模型已不再是焦点,文生图、文生视频、音频将是今年各大模型厂商的重点,相比较文本训练数据,优质且多样性的图片、视频、音频非常稀缺。整个A股,图片、视频、音频数量较多的公司如下:
1.$视觉中国(SZ000681)$ 4亿张图片、3000万条视频、35万首音频,其中视频我们按30s算,也有差不多25万小时。最重要的是它拥有海外图库以及摄影社区,将是美国多模态训练数据收费的最佳受益者
2.$中广天择(SH603721)$ 20万小时,已供应万兴科技4万小时训练
3.$华策影视(SZ300133)$ 7万小时
4.捷成股份 5万小时
6.其他