DeepSeek App满月 联想AI服务器单机可部署满血大模型

DeepSeek App满月 联想AI服务器单机可部署满血大模型

来源:中国日报网 2025-02-25 16:16
  • weixin
  • weibo
  • qqzone
分享到微信

在DeepSeek App上线一个月之际,联想正式宣布,旗下大模型训推一体AI算力平台联想问天 WA7780 G3、大模型推理AI算力平台联想问天 WA7785a G3全新升级,单机即可部署DeepSeek-R1满血版大模型(具备671B参数)。此次升级将大幅降低客户部署难度和成本,同时提升模型训练和推理性能,为DeepSeek等最新AI应用的落地和规模化发展提供强有力的支持。

据悉,联想正与DeepSeek在个人智能与企业智能两大领域,开展更全面、深入的合作。其中,聚焦企业智能,联想中国基础设施业务与DeepSeek的深度融合,正快速实现从训练到推理的全链条产品适配。

据了解,DeepSeek大模型凭借高性能、低成本和开源三大特点,助力各行业加速应用大模型技术推动业务升级转型。DeepSeek-R1满血版大模型基于6710亿参数,具备卓越的复杂推理和深度交互能力,众多企业积极探索并部署DeepSeek-R1满血版大模型以期提升业务效能与竞争力。然而,在实际应用中,用户在本地接入时不可避免遇到算力基础设施匮乏、训练推理服务性能难以达标等一系列难题。

面对用户实际应用问题,联想问天 WA7780 G3、联想问天 WA7785a G3与DeepSeek-R1满血版大模型特点进行了深度适配调优,单机即可部署DeepSeek-R1满血版大模型,助力企业高效完成本地化部署,一站式构建AI生产力,加速智能化升级。

值得一提的是,联想问天 WA7780 G3大模型训推一体服务器是为打破AI算力供给困境而来,能够为训练推理提供强劲的算力支撑。

作为领先的AI算力平台,这款服务器内嵌Transfomer Engine, 支持FP8优化,可以帮助DeepSeek-R1满血版大模型获得更好的模型训练和推理性能。

在显存方面,提供超1T HBM3e,充分满足DeepSeek-R1满血版大模型FP8精度下不低于800GB显存容量的需求。显存带宽高达4.9TB/s,可以在推理解码阶段实现极致加速。

在高速互联方面,GPU P2P通信带宽达900GB/s,同时单机提供3.2TB/s的高带宽低延迟网络扩展,能够为DeepSeek-R1满血版大模型提供极低的通信延迟。

联想问天 WA7780 G3大模型训推一体服务器

联想问天 WA7785a G3服务器则聚焦于AI算力优化,该大模型推理AI算力平台原生支持FP8,提供超1.5T HBM3e,为DeepSeek-R1满血版大模型插上性能腾飞的翅膀。

此外,显存带宽达5.3TB/s的高速显存可以减少数据传输的瓶颈,从而加速训练过程,提高模型训练效率。GPU聚合带宽达896GB/s,同时单机提供3.2TB/s的高带宽低延迟网络扩展,充分满足了DeepSeek-R1满血版大模型并行计算时跨节点的通信需求,使其成为用户首选大模型推理服务器。

联想问天 WA7785a G3服务器

此外,联想正在加速推进DeepSeek 671B-R1和V3模型及一系列蒸馏模型与其AI服务器的适配。未来,联想将持续创新为企业提供全面、高效、可靠的IT基础设施,加速推动AI创新与应用落地,为千行万业积极拥抱AI注入强大动力。

免责声明:该文章旨在为读者提供更多新闻资讯,所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:舒靓】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn
C财经客户端 扫码下载
Chinadaily-cn 中文网微信