发布于: Android转发:0回复:0喜欢:1
中证聚焦
开放算料联盟成立 围绕高质量中文数据开展合作
面对中文语料数据不足的困境,国内多方主体决定抱团聚力。据报道,近日深圳数交所联合近50家单位成立“开放算料联盟” 。参与公司不仅有联通、电信两大运营商以及腾讯云,还包括多家上市公司。据介绍,该联盟将围绕高质量中文训练数据和多模态训练数据,协调数据要素、数据治理、训练数据、数据标注、合成数据等相关标准制定,协助数据交易所增加大模型相关的新品类和新专区。
点评:大模型、算力、数据是生成式人工智能发展的三大支柱。数据是关键生产要素和生产资料,也可以说是AI的算料。联盟各成员将共同贡献、整理、倡导贡献自然语言、图像视频、语音音乐、程序代码、生物信息、合成数据等多模态训练数据,为解决人工智能数字经济 的数据荒问题,特别是解决多模态数据荒、中文数据荒、中国文化、中国价值观数据荒等问题提供强有力支撑。
◆A股公司中,中文在线300364)致力于成为全球领先的中文数字出版机构。公司以版权机构、作者为正版数字内容来源,进行内容的聚合和管理。海天 瑞声(688787)主营AI训练数据的研发设计、生产及销售业务,主要产品有数据资源定制服务、数据库产品、数据资源相关的应用服务。$南方传媒(SH601900)$ $中信出版(SZ300788)$ $横店影视(SH603103)$