国家区块链中心牵头共建人工智能语料共享新模式

国家区块链中心牵头共建人工智能语料共享新模式

来源:中国日报网 2024-07-01 16:47
  • weixin
  • weibo
  • qqzone
分享到微信

中国日报7月1日电(记者 赵磊)日前,新华社国家重点实验室、人民网、中国科学院文献情报中心、北京广播电视台、高等教育出版社、首都图书馆、中央电化教育馆出版社、万方数据、中国知网等语料数据重点单位宣布,联合国家区块链技术创新中心,共同成立高价值语料可信安全流通生态体系。运用区块链、隐私计算等前沿信息技术,全国范围的大模型语料资源将在隐私安全保护和流转增值激励中,形成可持续、自生长的数据供给生态,赋能人工智能大模型领域加速高质量发展。

近年来,人工智能技术快速发展,在国民经济运行关键领域发挥日益重要的作用。特别是各类人工智能大模型的应用,为各行业加速形成新质生产力提供了无限机遇。人工智能大模型的发展,其训练使用的高价值语料数据是关键因素。

当前,高价值语料数据跨单位、跨行业、跨地区分布,但由于缺乏足够的隐私安全保障和有效的激励机制,语料数据拥有者往往“不敢分享”“不愿分享”,造成大量高价值语料数据“供给难、流通难、使用难”,已经成为我国人工智能进一步发展的瓶颈。以区块链、隐私计算为代表的新一代信息技术,凭借着可信存证、不可篡改、易确权、充分保护数据隐私安全等优异性能,可以保障语料数据可信安全地流通、使用和管理,一举破解上述难题。

此次加入生态体系的成员均是国内语料数据领域的核心单位。成员单位将运用我国自主可控、性能领先的区块链软硬件一体基础设施,搭建起覆盖全国的分布式语料数据互联互通桥梁,链接语料供给方、加工方、需求方,实现全国分布式语料数据可信接入,跨地域可发现、可访问,形成高质量语料数据集。同时,成员单位运用区块链智能合约技术,实现语料数据流通全链路透明、自动“计量结算”,激励语料拥有者分享数据;运用创新隐私计算技术,保障大模型高价值语料数据在处理加工和模型训练过程中无法二次传播。

此外,生态体系的共建各方还将开展基于区块链与隐私计算的语料数据可信安全流通规范制定,形成高价值语料数据流通与增值的可持续生态,推动我国人工智能领域通用大模型与行业大模型的高质量发展。

【责任编辑:严玉洁】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn
C财经客户端 扫码下载
Chinadaily-cn 中文网微信