MiniMax M3 上线并行科技MaaS平台:一个模型,全能进化!

2026-06-10 10:07:34
分享
文章提及标的
并行科技--
Benchmark--

2026年6月1日,国内首个集齐 1M 超长上下文、原生多模态与顶级 Coding/Agent 三大能力的模型——MiniMax M3 正式发布!这不仅是一款性能比肩国际顶尖的“全能选手”,更是目前同级别中唯一的开源模型。

并行科技 MaaS 平台已第一时间完成 M3 接入,以海量算力破除门槛,让顶尖大模型“开箱即用”。告别算力焦虑,一键开启您的普惠智算之旅!

https://www.paratera.com/mass.html

M3 是 MiniMax 面向 Agentic Engineering 场景打造的新一代模型能力升级,能够更好地完成复杂任务拆解、代码生成、工程协作、文档理解和多模态信息处理。

01

架构革新:MSA稀疏注意力

MiniMax M3采用了全新的 MiniMax Sparse Attention (MSA) 架构。不同于传统的全注意力机制(计算复杂度随长度平方级增长),MSA 通过更精确的 KV 分块,配合算子层优化,实现了极高的计算效率。

性能收益:

成本降低:在 100 万上下文下,每 token 计算量仅为上代模型的 1/20。

速度飞跃:Prefilling 阶段加速 9 倍,Decoding 阶段加速 15 倍。

硬件友好:比开源的 Flash-Sparse-Attention 快 4 倍以上,真正实现了“长上下文”的普惠。

02

能力越级:比肩国际顶尖模型

在多项国际权威评测中,M3 展现出了比肩甚至超越海外闭源模型的实力:

03

实战表现:从“写代码”到“做科研”

M3 不仅在 Benchmark(BHE) 上跑分高,更在复杂的真实任务中表现出色:

独立复现顶会论文:M3 成功独立复现了 ICLR 2025 Outstanding Paper Award 获奖论文,自主运行 12 小时,产出 18 次 commit 与 23 张实验图表,并跑通核心实验。

自主优化 CUDA 算子:在没有参考代码的情况下,M3 自主优化了 NVIDIA Hopper 架构的 FP8 GEMM kernel,将硬件峰值利用率从 7.6% 提升至 71.3%(实现相较于原始版本的 9.4× 加速)。

自我迭代训练:在 PostTrainBench 任务中,M3 自主完成了数据合成、训练、评测的全流程,最终得分(0.37)略低于 Opus 4.7(0.42)和 GPT-5.5(0.39),但明显领先其他模型。

如何体验M3?

MiniMax M3现已上线并行科技MaaS平台,把模型能力从“更强”推进到“更能干活”。并行科技提供灵活的按需调用与本地私有化部署,以海量GPU资源免去前期投入,实现极致性价比;7×24小时专业技术服务团队全程护航,让应用落地无后顾之忧。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈