大模型时代的到来,正加速推动人工智能开发从以模型为中心朝着以数据为中心的方向转变。贾宇航认为,当前大模型算法技术的突破对人工智能行业化落地产生革新,对应处理数据类型更加丰富,云测数据发布的面向垂直行业的大模型数据解决方案,可以帮助垂直行业企业可以更好的落地大模型相关算法应用。
云测数据垂直行业大模型数据解决方案可以为行业客户深度定制数据采集方案,助力获取高价值数据,在面对微调任务会根据大模型落地场景特点,提供包含QA-instruct、prompt等文本类任务项目和多模态大模型的相关能力支持。在完成微调后,云测数据通过垂直领域的人员和专家积累+评测体系和服务,帮助企业对各个垂直应用落地领域进行评估。并通过以集成数据底座为核心的数据标注平台,将难例数据回流完成清洗标注,为更有效率的模型调优做准备。
大模型技术的应用,将提高数据标注的效率,同时对于数据标注规模、人工参与程度等产生影响。贾宇航表示“伴随人工智能企业自动标注能力提升,标注将逐步从手工标注,衍化为算法自动标注人工校验和人工标注。但伴随算法的实际量产,数据闭环能力增强,整体标注数据量和手工数据标注量依然逐年上升”。同时,在算法应用落地,数据闭环驱动算法进一步提升的基础上,AI数据处理的工具链也进一步工程化迭代。
云测数据提供的数据处理平台工具,通过标准API接口与其他业务系统集成,可对接各类模型,形成数据输入输出、模型调用辅助标注、Hook对接等数据闭环管理,并提供数据管理OPENAPI、命令行工具、OAuth2授权登录等开发支持,方便系统集成及构建数据闭环应用场景,适用于新一代AI工程化数据处理工作台,可助力AI数据训练过程综合效率提升200%。
来源:云测数据