摩尔线程升级智算集群解决方案,万卡集群成AI主战场标配

摩尔线程升级智算集群解决方案,万卡集群成AI主战场标配

来源:中国日报网 2024-07-03 20:01
  • weixin
  • weibo
  • qqzone
分享到微信

中国日报7月3日电(记者 马思)7月3日,芯片设计公司摩尔线程宣布其AI旗舰产品夸娥(KUAE)智算集群解决方案实现重大升级,从当前的千卡级别大幅扩展至万卡规模。摩尔线程是国内明星初创企业之一,其核心产品是图形处理器(GPU)。随着大模型参数越来越多,对算力的需求越来越高,GPU成为当前市场备受追捧的产品。

以大模型为代表的新一代人工智能技术成为引领新一轮科技革命和产业变革的战略性技术和重要驱动力量,同时随着对算力需求的日益高涨,人工智能算力公司日益成为新一波人工智能技术浪潮重要组成部分。大模型的发展也激发了新的投资热潮,地方政府、大型科技企业等都纷纷布局建立智算中心,而GPU在这些智算中心的运行中发挥了关键作用。

摩尔线程创始人兼CEO张建中表示,在多元趋势下,万卡已是AI模型训练主战场的标配。随着计算量不断攀升,大模型训练亟需超级工厂,即一个“大且通用”的加速计算平台,以缩短训练时间,实现模型能力的快速迭代。当前,国际科技巨头都在通过积极部署千卡乃至超万卡规模的计算集群,以确保大模型产品的竞争力。随着模型参数量从千亿迈向万亿,模型能力更加泛化,大模型对底层算力的诉求进一步升级,万卡甚至超万卡集群成为这一轮大模型竞赛的入场券。

摩尔线程创始人兼CEO张建中

张建中表示,万卡集群是超级复杂的系统工程,挑战在于超大规模的组网互联、集群有效计算效率,以及训练的高稳定性等。目前,夸娥万卡集群的有效计算效率超过60%,平均无故障运行时间15天。大模型用户可以通过编译器等方式从英伟达CUDA体系实现迁移。

7月3日当天,摩尔线程联合中国移动通信集团青海有限公司、中国联通青海公司、北京德道信科集团、中国能源建设股份有限公司总承包公司、桂林华崛大数据科技有限公司分别就三个万卡集群项目进行了战略签约,多方聚力共同构建好用的国产GPU集群。

据介绍,摩尔线程夸娥(KUAE)万卡智算集群,以全功能GPU为底座,旨在打造国内领先的、能够承载万卡规模、具备万P级浮点运算能力的国产通用加速计算平台,专为万亿参数级别的复杂大模型训练而设计。专家表示这一里程碑式的进展,树立了国产GPU技术的新标杆,有助于实现国产智算集群计算能力的全新跨越,将为我国人工智能领域技术与应用创新、科研攻坚和产业升级提供坚实可靠的关键基础设施。

 

【责任编辑:严玉洁】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn
C财经客户端 扫码下载
Chinadaily-cn 中文网微信