当前所在:网站首页> 典型案例

贵数所上线五百七十二个人工智能高质量训练数据集

发布时间:2024-05-29 作者:佚名 来源:贵州省人民政府

  近日,贵阳大数据交易所以全国首个数据要素登记行业节点DOID为载体,上线572个人工智能高质量训练数据集,首创数据要素行业稀有地图,为人工智能大模型发展精准赋能。

  本次上线的数据集汇聚了丰富数据资源,首批高质量人工智能大模型训练数据集供给方来自中文在线、中国开放数据、拓尔思、海天瑞声、曼孚科技、粟特方舟、国信数据等16家企业和机构,涵盖“数据要素×”金融服务、工业制造、医疗健康、商贸流通等多个重点领域,涉及文字、音频、图片、视频等多种模态,旨在汇聚全面、系统、权威的高质量人工智能大模型训练数据集,为人工智能大模型厂商提供燃料。

  “这次中文在线在贵数所上线的数据集产品包括了中文在线数字图书馆数据集、有声音频书数据集、中小学题库数据集、高校职教题库数据集、视频资料数据集等。”北京中文在线阅读公司执行董事兼总经理杜嘉说,这些数据集对于目前的AI大模型语料训练、数字图书馆建设、数字教育内容资源建设等可以发挥积极的作用,期待与贵数所协力共赢,共创数据要素新篇章。


原文链接:https://www.guizhou.gov.cn/home/gzyw/202405/t20240523_84671760.html
[免责声明] 本文来源于网络转载,仅供学习交流使用,不构成商业目的。版权归原作者所有,如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间处理。
分享到: