数字经济时代,数据已经成为重要战略资源和关键生产要素,激活数据要素潜能、释放数据要素价值成为推动数字经济发展的关键举措。以技术与顶层机制建立健全数据要素市场,则是充分发挥数据价值的重要保障。
9月3日,由世界人工智能大会组委会办公室指导,粤港澳大湾区大数据研究院、开放群岛开源社区、智能投研技术联盟(ITL)、FATE开源社区联合主办的2022世界人工智能大会-数据要素流通技术前沿探索论坛在上海召开。论坛以“开放共生,数实融合”为主题,30余位学术界、产业界、科研及行研机构专家学者与行业领袖,围绕数据要素市场基础制度与技术、产业发展进行深度交流与探讨,并发布了多项产业及学术成果。
“当前,我国数据要素的顶层布局逐步细化,各地围绕数据要素开展先行先试,但数据产权划分、保护、交易流通的滞后引发数据孤岛、数据垄断等现象,为数据要素流通产生阻碍。”中国信通院云大所所长何宝宏提到,培育数据要素市场的核心思路在于健全数据市场规则,厘清数据产权,确定数据价值评估方式,强化隐私计算等关键技术创新,实现数据要素的“殊途同归”。
中国人工智能学会(CAAI)荣誉副理事长、加拿大工程院院士、加拿大皇家科学院院士杨强在演讲中表示,开源开放是大势所趋。开源是数据要素流通产业发展的一条重要“中轴线”,建设并发展开源社区,让更多角色参与数据流通技术生态,让技术在接受更多维度检验的同时,建立起更加敏捷、全面的反应机制,推进技术迭代与产业发展,进一步促进数据要素流通与价值释放。
中科院软件所总工程师、智能软件研究中心主任武延军同样表示,开源已成为数字经济的主流模式,是数字创新的新引擎。过去二十年,开源成就了全球互联网和终端产业,商业价值凸现。当前,得益于开放指令集的崛起和AI辅助编程工具的广泛应用,开源生态和模式或将迎来重大变革和迭代升级。
对于如何真正实现“开源”,杨强认为,效率、安全、普惠、有效性及场景普及是开源最重要的几大技术要求。杨强特别提及可信联邦学习,该技术是在联邦学习分布式联合建模基础上,加入安全可信的机制,保障模型的高效可用、可管理、可审计,且普惠。可信联邦学习的安全可证明,模型性能可使用,决策可监督,模型可监管以及普惠等特性,为培育高质量的数据要素市场提供基础性技术支撑。
香港科技大学教授、智能网络与系统实验室主任、星云Clustar创始人陈凯在演讲中,系统分析了可信联邦学习等数据要素流通核心技术的算力挑战与解决之道。陈凯表示,安全、效率、效果的平衡与统一,是数据要素流通技术走向规模化应用的关键。以算法与协议创新,算力硬件加速,网络优化加速等软硬件结合技术手段,在保障数据隐私安全与数据建模效果的前提下,提升计算效率,是未来数据要素流通基础设施建设的重要路径。星云Clustar将充分发挥在隐私计算算力加速领域的积累与创新,进一步与广泛生态伙伴合作,共建高安全、高效率、高可用的数据流通生态。
华为公司数据总架构师马运也表示,考虑到数据要素易复制、难确权、难定价、非排他性等特性,数据想要成为生产要素流通,需从数据清洁、共享与可控交换着手,让数据与货币一样在流动中不断增值。华为从2014年便开始探索与构建真正可让数据放心流动的治理体系与IT平台。目前,华为构建了企业数据底座,以“管入、管存、管出、管用”的平台能力实现企业内数据的高效共享与敏捷自助,同时构建了EDS企业数据空间,以“可信、可控、可证”平台能力实现企业间数据的可控交换与价值释放。
论坛期间,一系列数据要素技术创新成果也集中发布。此次论坛全面展示了数据要素流通领域的技术前沿、实践经验及发展趋势。作为2022世界人工智能大会的重要组成部分,从理论和实践两方面总结了数据要素流通最新成果,输出了大量数据流通产业的价值信息,将成为2022年度数字经济高质量发展的引擎。