MiniMax M3 上线并行科技MaaS平台：一个模型，全能进化！

2026年6月1日，国内首个集齐 1M 超长上下文、原生多模态与顶级 Coding/Agent 三大能力的模型——MiniMax M3 正式发布！这不仅是一款性能比肩国际顶尖的“全能选手”，更是目前同级别中唯一的开源模型。

并行科技 MaaS 平台已第一时间完成 M3 接入，以海量算力破除门槛，让顶尖大模型“开箱即用”。告别算力焦虑，一键开启您的普惠智算之旅！

https://www.paratera.com/mass.html

M3 是 MiniMax 面向 Agentic Engineering 场景打造的新一代模型能力升级，能够更好地完成复杂任务拆解、代码生成、工程协作、文档理解和多模态信息处理。

01 架构革新：MSA稀疏注意力

MiniMax M3采用了全新的 MiniMax Sparse Attention (MSA) 架构。不同于传统的全注意力机制（计算复杂度随长度平方级增长），MSA 通过更精确的 KV 分块，配合算子层优化，实现了极高的计算效率。

成本降低：在 100 万上下文下，每 token 计算量仅为上代模型的 1/20。

速度飞跃：Prefilling 阶段加速 9 倍，Decoding 阶段加速 15 倍。

硬件友好：比开源的 Flash-Sparse-Attention 快 4 倍以上，真正实现了“长上下文”的普惠。

M3 不仅在 Benchmark（BHE）上跑分高，更在复杂的真实任务中表现出色：

独立复现顶会论文：M3 成功独立复现了 ICLR 2025 Outstanding Paper Award 获奖论文，自主运行 12 小时，产出 18 次 commit 与 23 张实验图表，并跑通核心实验。

自主优化 CUDA 算子：在没有参考代码的情况下，M3 自主优化了 NVIDIA Hopper 架构的 FP8 GEMM kernel，将硬件峰值利用率从 7.6% 提升至 71.3%（实现相较于原始版本的 9.4× 加速）。

自我迭代训练：在 PostTrainBench 任务中，M3 自主完成了数据合成、训练、评测的全流程，最终得分（0.37）略低于 Opus 4.7（0.42）和 GPT-5.5（0.39），但明显领先其他模型。

MiniMax M3现已上线并行科技MaaS平台，把模型能力从“更强”推进到“更能干活”。并行科技提供灵活的按需调用与本地私有化部署，以海量GPU资源免去前期投入，实现极致性价比；7×24小时专业技术服务团队全程护航，让应用落地无后顾之忧。