华为昇腾适配DeepSeek V4，粤产算力芯片加速商用

关键词：

算力概念

华为昇腾

人工智能

华为

　　南方财经记者郑康喜深圳报道

　　将8192张昇腾NPU卡高速互联，为超大规模AI训练与海量推理并发场景提供源源不断的算力支撑，可大幅提升大模型训练效率、可靠性与推理性能。

　　这是4月27日举办的广东省人工智能应用对接大会现场，华为展示的新一代算力底座。华为公司副总裁杨伟军表示，华为充分发挥在计算、网络和存储方面的优势，通过系统性协同，打造超节点集群方案，实现规模算力领先。

　　2025年8月5日，华为正式宣布昇腾全量软件开源开放。同时，华为积极拥抱和贡献三方开源生态，目前已累计支持了50多个开源项目、200多个大模型，使得业界无需再关注模型的迁移和调优。

　　杨伟军在大会现场表示，为应对超大规模的AI中心训推计算需求，超节点产品应运而生。

　　“我们的Atlas950全液冷超节点，通过超大算力、超高带宽和超低时延，高效支撑大模型训练和大并发推理。基于华为在光电互联能力上的积累，Atlas950最大可支持8192卡高速互联，成为一台超级计算机，这是业界最大规模的超节点。”杨伟军说。

　　和传统集群相比，Atlas950超节点的大模型训练性能翻番，可稳定运行30小时以上，可靠性是业界平均水平的10倍。推理时延从50ms降低至10ms，满足风控分析等极致时延要求。

　　目前，更多企业正加速自用场景的AI推理实践，并逐步扩展至toB、toG等场景。

　　4月24日，DeepSeek V4-Pro和DeepSeek V4-Flash正式发布并开源，模型上下文处理长度由原有的128K显著扩展至1M，实现近10倍的容量提升。

　　随后，华为计算发布信息称，昇腾超节点产品全面支持DeepSeek V4。本次通过双方在芯模技术层面的紧密协同，昇腾超节点全系列产品已可全面支持DeepSeek V4系列模型。

　　市场普遍将此次协同解读为国产大模型与国产算力深度合体的重要标志，意味着国内AI推理正逐步减少对海外算力的依赖。

　　“我们提供8卡单机或16卡双机的一体机方案，最佳适配DeepSeek V4等万亿MoE大模型的推理，性能开箱即优，支撑应用天级上线。”杨伟军表示。

　　同时，华为还提供超节点+大EP方案，支持从32到1024卡平滑扩容，单卡推理吞吐最大可提升三倍，故障后分钟内即可快速恢复，保护客户投资。

　　当前，行业内对国产算力产业链的发展前景保持乐观。DeepSeek V4等国产大模型原生适配国产算力，能够推动国产算力芯片供给能力大幅增强，这对于中国推动人工智能赋能千行百业意义深远。

　　以广东为例，作为人工智能产业大省，广东人工智能核心产业规模约占全国四分之一，共有142个大模型通过国家备案，位居全国第三，超430个垂类行业模型落地。但目前，很多大模型依旧依赖国外AI芯片。

　　而今，随着昇腾生态与伙伴共同加速AI应用落地，广东推动人工智能应用走向全域全时全行业，便有了底层技术的加持。

　　近期，深圳华强表示，公司已初步构建从算力器件、硬件板卡、AI算法至系统集成的全链路资源体系，完成昇腾边缘AI模组、昇腾边缘AI推理计算盒等多款基于昇腾解决方案的产品开发。未来，公司将继续以昇腾为核心构建AI业务基本盘，融入昇腾端、边、云全栈生态体系，推进昇腾相关技术和产品的规模化落地与推广。