数据要素叠加中字头真香$中国出版(SH601949)$ $中信出版(SZ300788)$
一直跟踪Ai的都会保持高度嗅觉,估计不少Ai信徒今天追高进入,除了嗅觉外,也许利润垫也是勇气来源,毕竟图腾科传不管是否持有,并不妨碍短线的信仰。
转:
欧洲MEP《人工智能法案》提案,对AI模型提出更严格监管要求:
1.版权披露:模型开发商将被要求披露在构建其系统时使用的任何版权材料。
2.公平竞争:生成式AI模型提供方不能单方面强加给中小企业和初创企业的不公平合同义务;
3.保障合法权利:保障隐私、非歧视等基本权利;
4.降低风险:模型发布之前需要在独立专家的参与下测试风险。
欧盟《人工智能法案》在5月11日的关键委员会投票前,该提案可能仍需在技术层面进行细微调整,全体投票则预计在6月中旬进行。若通过,则该将成全球首个AI法律监管框架。该法案将产生全球影响,其适用在欧盟区内提供的所有AI系统,无论其供应方来自当地还是英美等第三方国家。
本次《人工智能法案》的提案,最值得关注的在于“要求披露模型在构建其系统时使用的任何版权材料”,这是对数据/版权供应方在生成式AI产业链地位的进一步肯定,版权方的权利也将在未来获得法律的保护。
1)地位得到法律确认和保护:生成式AI会从公开网站或专业数据库获取大量素材作为训练数据,素材的提供方理应当享有AI生成内容所带来的收益。但因素材来源庞杂、追溯确权困难、模型方版权保护意识尚未形成等原因,模型生成的内容并不会披露所依据素材的来源,容易引发侵权问题。此前全球最大的专业图片库公司Getty Images就起诉Stability AI从网站上窃取了数百万张图片。
欧盟《人工智能法案》提案中的上述要求,意味着大模型调用训练素材的行为将得到监督,数据和版权方的权益将得到保护,他们也从而获得主张更多权利的机会。
2)数据资源商业化有望得到法律支持:当数据供应公司、个人创作者等素材供应方,以单独个体被大模型公开披露时,其可在法律的保护下,向大模型寻求对生成内容收益的分成,实现数据资源变现。
结合欧盟本次《人工智能法案》提案、Reddit等互联网平台对大模型公司调用API收费,及网信办《生成式AI服务管理办法(意见征求稿)》,可以看到从政策法规到实际产业界的探索,在人工智能大模型火爆的当下,数据及版权保护成为重要议题。我们认为,大模型为具有版权的数据资源进行付费,将成为生成式AI的产业趋势。具有海量优质版权、数据资源的公司将充分受益。从产业优先级来看,基于大语言模型训练,文字类版权将率先受益。后续则为图片、视频类版权。
$中国科传(SH601858)$ $中信出版(SZ300788)$