贵数所上线高质量训练数据集专区

空婵数据 2024-05-18 05:42:19

导读:近期,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》中明确提出,要提升数据供给水平,打造高质量人工智能大模型训练数据集。

为贯彻落实“数据要素×”三年行动计划,近日,贵阳大数据交易所以全国首个数据要素登记行业节点DOID为载体,上线572个人工智能高质量训练数据集,首创数据要素行业稀有地图,为人工智能大模型发展精准赋能。

高质量训练数据集专区5大亮点披露

1.丰富数据资源汇聚

首批高质量人工智能大模型训练数据集供给方来自中文在线、中国开放数据、拓尔思、海天瑞声、粟特方舟、曼孚科技、粟特方舟、国信数据、宽凳科技、新气象科技、香侬科技、晴数智慧、中科富创、北方健康、中财数碳、数联铭品等16家企业和机构,汇聚572个人工智能高质量训练数据集,涵盖“数据要素×”金融服务、工业制造、医疗健康、商贸流通等多个重点领域,涉及文字、音频、图片、视频等多种模态,旨在汇聚全面、系统、权威的高质量人工智能大模型训练数据集,为人工智能大模型厂商提供燃料。

2.权威认证与质量保障

首批挂牌人工智能高质量训练数据集需经过贵州省数据流通交易服务中心审核,并取得数据要素登记凭证,确保数据授权链路清晰,为数据需求方提供可信赖的高质量数据源,提高人工智能大模型训练效率与效果。

3.数据要素行业稀有地图

贵阳大数据交易所创新性地推出数据要素行业稀有地图功能,对首批挂牌上市的人工智能高质量训练数据集稀缺性和独特性进行科学评估。需求侧方面:数据需求方进入贵阳大数据交易所平台,查找垂直行业高质量训练数据集一键搜索精准触达,结合自身需求选购标准数据集或进行定制化数据集采购。

供给侧方面:数据要素行业稀有地图可以为数据提供方展示数据集在垂直行业的需求程度,指引数据商在数据集稀缺行业填补市场空白。

4.高端定制化服务

除汇聚标准人工智能高质量训练数据集外,贵阳大数据交易所提供高端定制化数据集需求撮合服务,可根据数据需求方个性化需求,定制专属数据集,满足人工智能模型训练要求。

5. 高质量数据集激励计划

支持各类市场主体通过数据交易平台提供高质量数据集,为开发、训练、应用大模型提供支持,每年安排资金总额不超过500万元,对训练使用量、数据质量等综合排名前10的市场主体给予奖励。

专家寄语

专家简介

王锋,中国质量认证中心区块链与数据服务部部长、江苏省区块链发展协会数据要素专委会秘书长。

专家寄语:祝贺贵阳大数据交易所上线高质量训练数据集专区,提供高质量的算料,是提升模型训练效率和效果的关键所在。打造高质量数据集的专业评价认证体系,有助于加强AI大模型供给侧算料品质,完善人工智能产业生态。为此,中国质量认证中心上线了大模型算料质量评价服务,未来将与贵数所共同研究、制定数据产品质量评价体系。

数据商展望

数据商代表

杜嘉:北京中文在线阅读公司执行董事兼总经理、全国工商联书业商会副会长、中国教育装备协会学校图书装备分会副理事长、中国图书馆学会阅读与出版专业委员会副主任委员、北京教育信息化产业联盟常务副理事长、清华科技园科协副主席。

数据商展望:“这次中文在线在贵阳大数据交易所上线的数据集产品包括了中文在线数字图书馆数据集、有声音频书数据集、中小学题库数据集、高校职教题库数据集、视频资料数据集等,这些数据集对于目前的Ai大模型语料训练、数字图书馆建设、数字教育内容资源建设等可以发挥积极的作用,期待与贵阳大数据交易协力共赢,共创数据要素新篇章。”

了解贵阳大数交易所高质量训练数据集专区入驻与高质量数据集激励计划请关注“贵阳大数据交易所”查看原文。

0 阅读:0

空婵数据

简介:感谢大家的关注