多模态训练数据如果收费,视觉中国将成最大受益者

发布于: 雪球转发:0回复:0喜欢:0

3月20日消息,据外电报道,周三,法国竞争监管机构对谷歌再次处以巨额罚款,原因是谷歌向法国出版商支付新闻费用的长期争议。

法国竞争管理局表示,由于谷歌未能遵守其在谈判框架中做出的一些承诺,因此对其处以 2.5 亿欧元(2.72 亿美元)的罚款。

此次纠纷是欧盟和世界各地当局为迫使谷歌和其他科技公司向新闻出版商的内容进行补偿而采取的更大努力的一部分。

解读:训练数据收费已成定局。今年是多模态高速发展的一年,拥有大量视频、音频、图片数据的公司将成为最大的受益者,之前有机构将之成为锂矿,

值得一提的是,大语言模型已不再是焦点,文生图、文生视频、音频将是今年各大模型厂商的重点,相比较文本训练数据,优质且多样性的图片、视频、音频非常稀缺。整个A股,图片、视频、音频数量较多的公司如下:

1.$视觉中国(SZ000681)$ 4亿张图片、3000万条视频、35万首音频,其中视频我们按30s算,也有差不多25万小时。最重要的是它拥有海外图库以及摄影社区,将是美国多模态训练数据收费的最佳受益者

2.$中广天择(SH603721)$ 20万小时,已供应万兴科技4万小时训练

3.$华策影视(SZ300133)$ 7万小时

4.捷成股份 5万小时

6.其他