同花顺 Logo
AIME助手
问财助手
面壁智能开源新一代全模态旗舰 AI 模型 MiniCPM-o 4.5,仅靠 9B 参数实现 SOTA
2026-02-04 21:01:19
来源:IT之家
分享
文章提及标的
天数智芯--
华为昇腾--

IT之家 2 月 4 日消息,面壁智能今日(2 月 4 日)开源了新一代全模态旗舰模型 MiniCPM-o 4.5。

作为原生全双工的全模态大模型,MiniCPM-o 4.5 通过“边看、边听、主动说”的全模态能力,让 AI 告别死板的“对讲机”回合制交互,号称成为行业首个“即时自由对话”的大模型,感知不中断、对话不死板、提醒无需问。

MiniCPM-o 4.5 已在 GitHub、Hugging Face 等平台开源。此外,基于统一系统软件栈 FlagOS 的跨平台能力,MiniCPM-o 4.5 在天数智芯(HK9903)华为昇腾(886058)、平头哥、海光、沐曦等 6 款芯片上均获得端到端推理性能提升。

沿袭面壁小钢炮一贯的“高密度”特点,MiniCPM-o 4.5 仅靠 9B 参数,在全模态、视觉理解、文档解析、语音理解和生成、声音克隆等方面,均做到了全模态模型 SOTA 水准。

在“能效比”方面,MiniCPM-o 4.5 通过更低的显存占用、更快的响应速度,确保在提供 SOTA 级全模态表现的同时,实现了更好的推理效率和更低的推理开销。

MiniCPM-o 4.5 通过新的模型设计和数据方法,让语音生成的音色、拟人度、声音表现力等方面获得了全方位的提升,在音频输出过程中,会自动选择最为合适的语气、音色。

值得一提的是,MiniCPM-o 4.5 也解决了长语音合成中音色不统一、语气不自然、效果不稳定难题。

在声音克隆上,MiniCPM-o 4.5 提供了更多的声音选择,可以基于几秒的声音样本克隆定制新音色,并基于克隆音色进行角色扮演的语音对话。

MiniCPM-o 4.5 采用了端到端的全模态架构,并加入了全双工多模态实时流机制、主动交互机制、可配置语音建模设计。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571涉企侵权举报

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈