首批100个高质量数据集!柏川数据深度参与

发布于: 雪球转发:0回复:0喜欢:0

近日,北京国际大数据交易所(以下简称「北数所」)正式发布首批100个高质量的人工智能大模型高质量训练数据集(以下简称「首批100个高质量数据集」)。作为国内领先的智能驾驶数据服务底座,柏川数据提供了智能驾驶非公开数据集,并基于深厚的移动视觉场景理解和专业积累,协助进行了「100个训练数据集」的数据场景类别划分、数据集参数指标制定、数据合规标准等工作,加速推动「数据要素x新质生产力」发展。

北数所作为国内首个以大数据为核心的交易平台,一直致力于促进数据资源的开放与共享,加速数据要素的流动和价值转化。据了解,「首批100个高质量数据集」覆盖自动驾驶、科技创新、金融服务、医疗健康、医药研发、气象服务、商业航天、影视创作等20多个应用场景,共计100余个语料数据,数据总量逾150PB,旨在满足不同行业对高质量数据的需求,为人工智能模型的训练和优化提供坚实基础。

作为深耕自动驾驶AI智能数据服务的头部企业,柏川数据具备贯穿数据采集、清洗、标注、仿真、模型训练等环节的全链条数据服务能力,累计数据采集时长超5000小时,累计数据标注元素量数亿帧。

紧跟出海热潮,柏川数据已在欧盟和东南亚开展数据服务业务,为全球30家+行业头部客户提供高质量解决方案和服务。基于国际布局和业务多样性,柏川数据已积累了场景多元、地域多元、种类多样的原始真实数据库,持续掌握最丰富、最实用的原始数据。

「首批100个高质量数据集」的发布,不仅为构建高质量模型训练语料生态提供了强有力支撑,更标志着国内首次形成了较成熟的数交所、数据方、模型方、算力方之间的协同和分润机制。柏川数据将以「100个训练数据集」的参与为契机,与北数所等生态机构和企业继续加深合作交流,持续致力于数据资源的深度开发和应用,推动人工智能技术在更多领域的广泛应用,加速行业智能化转型升级。