【2026 年 5 月 22 日,北京】鲲鹏昇腾开发者大会 2026(KADC2026)期间,面向超节点,打造开源易用的昇腾 AI 框架专题论坛顺利举办。
论坛聚焦超节点技术创新与开源生态建设,全方位展示了昇腾 AI 框架的最新进展。会上正式发布了 Ascend for PyTorch 社区,并深度复盘了昇思 MindSpore 在分布式并行、图算融合等前沿领域的创新成果作为组件化支撑 PyTorch 等三方社区合作。
多位学术界与产业界大咖也分享了基于昇腾 AI 框架共创成果以及高校开发者在 API 一致性补齐中的技术路线。线下更吸引了数百位开发者沉浸式体验,有力彰显了昇腾与开发者同行、共筑繁荣 AI 生态的决心。
PART 01
华为 AI 框架 PE 王紫东在《技术筑底,开源向新 —— 昇腾 AI 框架与开发者同行》的主题演讲中表示,从开发者使用习惯出发,围绕开发一致性、组件化创新、开发者体验三个方向,持续优化开发者体验,提供高效成长路径。
联合 PyTorch 基金会成立 Ascend for PyTorch 社区,加速开发一致性对齐。面对 PyTorch 版本发布节奏加快,图模型、分布式代码提交占比增高,将利用 Ascend for PyTorch 社区聚集开发者力量加速 API 一致性对齐、特性对齐,实现昇腾开发一致体验。并配合 PyTorch 社区重构 CICD,年底实现 PyTorch 版本在昇腾上同步发布。
面向超节点,昇思 MindSpore 打造昇腾亲和组件,加速主流生态对昇腾使用优化。昇思 MindSpore 聚焦超节点技术创新,在分布式、图模式领域构建 HyperParallel、AKG 等昇腾亲和组件,并支持 PyTorch,LlamaFactory 等主流生态复用,做好创新先头兵。
开源社区,百万激励,助力开发者快速融入社区共建。为开发者提供 2000+ 社区任务 & 竞赛活动和全方位的算力、激励,助力开发者共成长。同时优化社区、文档和课程等开发者资源,加速开发者学习到贡献路径。
PART 02
LlamaFactory 社区 Maintainer 郑耀威带来《LlamaFactory×HyperParallel:重构大模型训练效率新范式》的议题分享。针对大模型微调中分布式编程复杂、调试困难及算力成本高昂等痛点,LlamaFactory 以统一易用的架构大幅降低了微调门槛,而 HyperParallel 则开创了分布式并行的“Triton 范式”,让高效并行如同编写串行代码般自然。
通过双方的深度解耦共建,开发者只需一行配置即可启用 HyperParallel,实现分布式加速,让高效微调训练真正“开箱即用”。
PART 03
昇思 MindSpore 社区开发者杜金烨和李希宸共同带来《AKG 图算融合组件,使能昇腾大模型图模式加速》的演讲,系统性介绍了关于 AKG 图算融合的多个组件包括基于 MLIR 的图层融合框架 MFusion、AI 融合算子编译器 AKG-Scheduler、实时 AI 算子编译 DVM 与 AI 驱动的 DSL 代码生成工具 AKG-Agent。并且对 AKG-Scheduler 关键创新融合算法反向拉取算法进行详细介绍。
同时也介绍了北航 HIPO 团队基于 AKG-Agent 的创新性 Agent 元提示方案,在设计、编码等多个模块上实现高质量提示词,实现 Triton 后端上精度与性能多方面提升。搭载 LLM 驱动的 DSL 生成,自动寻优性能提升显著。组件化可一键部署,零代码优化模型训推,编译时长降低 50%+,目前已合入主线,全面赋能昇腾大模型图模式加速。
PART 04
PyTorch Ambassador 宗泽升在《PyTorch 多后端生态面临的挑战与标准化建设》议题中介绍了为 PyTorch 生态系统当前的最新进展,以及 PyTorch 框架接入机制技术演进。讲解了作为后端加速器开发者在社区贡献过程中遇到的挑战、解决方案和案例研究。
针对新设备接入 PyTorch 过程中,面临的版本兼容性、用例无法复用、缺乏标准化质量验证机制问题。通过 PyTorch 加速器工作组在社区中征集意见,推进 PyTorch 测试框架重构、提供 CI Relay 机制、Hud Dashboard 接入等能力事项,为社区后端加速器验证提供基础能力保障。
PART 05
面壁智能多模态首席科学家、清华大学人工智能(885728)学院助理教授姚远以“迈向类人交互的多模态大模型”为题,分享了 MiniCPM-o 4.5 在全模态交互方向的最新进展。该模型面向“边看、边听、主动说”的实时场景,支持视觉、语音、文本的端到端统一建模,可实现全双工输入输出、低延迟语音生成、自主打断、插话与主动回复。现场演示中,模型展现出流畅自然的多模态实时交互能力,能够像真人一样根据画面、语音和上下文即时响应,带来更具陪伴感和沉浸感的人机对话体验。
此前,面壁智能 / OpenBMB 已与华为昇腾(886058)生态围绕 AI 框架、分布式训练、模型架构优化和国产算力开展合作探索,本次双方将进一步推出 OpenBMB× 华为昇腾(886058) AI 框架联合赛事,围绕 MiniCPM-o 系列模型在昇腾 NPU 上的推理适配、性能优化与创新应用,鼓励高校学生和开发者共同探索全模态模型的产业化落地。
PART 06
Ascend for PyTorch 社区开发者刘劲帆围绕“API 一致性补齐实践”进行了分享,系统介绍了 PyTorch 生态向昇腾 NPU 迁移过程中的关键工程问题。
API 一致性是在昇腾上使用 PyTorch 生态的核心基石。PyTorch 作为 AI 领域事实标准,一致性对齐并不是简单“改几行代码”或新增接口,而是要准确理解 PyTorch 官方语义,实现 API 与官方语义对齐可实现从“能跑”到“可信迁移”的跨越,保障接口功能、行为、测试与文档全维度一致,以此降低开发者代码改造成本。
API 一致性正在流程化作业,与开发者共同探索加速。目前和 30+ 位开发者归纳流程标准,大家遵循检索、判断、适配、验证、提交的标准化工(850102)程闭环,聚焦用例、功能、文档三类补齐工作,通过 issue 与 PR 完成问题定位、适配修复与验证提交。开发者们携手攻克测试检索、适配边界、多版本兼容等实践难点,沉淀规范流程与协作经验,合力提交大量 issue 与 PR,持续提升 API 一致性与可信度,共同推动在昇腾上使用 PyTorch 的开发体验一致。
未来,昇腾 AI 框架将持续围绕开源易用为目标,携手生态力量为开发者提供一致开发体验和创新技术,让开发过程好用易用!
