7月30日上午,2024中国国际大数据产业博览会新闻发布会在北京召开。记者从发布会上获悉,贵阳贵安正以“东数西算”为重要契机,充分发挥数据中心集群、算力规模、数据开放和应用场景等方面优势,全力建设人工智能大模型训练基地。
贵阳贵安正按照国家数据局“五个一体化”要求,统筹算力、数据、算法的协同应用,建设智算服务中心、模型训练中心、数据流通中心、人才培养与联合创新中心、产业赋能中心“五个中心”,加快构建以昇腾算力为核心的人工智能大模型生态体系,为全社会生产生活提供普惠、易用、低价、绿色和安全的算力服务。
一是提供充沛低成本算力。截至目前,贵阳贵安智算规模超过33Eflops,预计今年年底将超过75Eflops,成为全国国产化智算能力最强的地区。依托澎湃算力,贵阳贵安以国有公司为主,联合华为、三大运营商等头部企业,面向全国拥有自研大模型的企业,提供以昇腾为主的多元异构算力服务,叠加“算力券”政策,为使用算力的企业提供优惠支持,让大家像使用电力一样,方便的、安全的使用贵阳贵安算力服务,开展大模型训练。
二是搭建开源模型训练平台。为了降低模型训练成本,贵阳贵安专门搭建公共服务平台,提供开源的基础模型和优惠算力,集成各种优秀的算法,为大模型企业提供模型预训练、模型调优推理、安全评测以及模型管理等,支持大模型一站式训练、推理、部署和运维,缩短行业模型的培育和应用建设周期。
三是提供高质量数据集。贵阳贵安以贵阳大数据交易所为平台,为大模型训练提供高质量训练数据集。目前,贵阳贵安首批挂牌的训练数据集包括金融服务、工业制造、医疗健康、商贸流通等多个领域,涉及文字、音频、图片、视频等多种模态,还包括一批骨干企业机构,包括中文在线、中国开放数据、拓尔思、新气象科技、海天瑞声等一批优秀企业,在这里为人工智能厂商、大模型厂商提供“燃料”。
四是积极开放场景应用。作为数字经济发展创新区核心区,贵阳贵安公共数据资源开发利用水平位居全国前列,在教育、旅游、医疗、数字人等各方面应用场景丰富、数据资源充足,可以为大模型训练落地应用提供良好环境。当前,贵阳贵安正联合华为、三大运营商等头部企业搭建开放式创新平台,建设昇腾、鲲鹏适配中心,围绕8个重点行业和4个重点领域,邀请优秀企业共同开展人工智能技术创新和应用研究,为大模型的商业化应用探索模式和路径。