同花顺 Logo
AIME助手
问财助手
罕见!DeepSeek、寒武纪同步重磅发布
2025-09-30 00:13:29
作者:卢鸰
分享
文章提及标的
寒武纪-U--

【导读】DeepSeek、寒武纪同步发布相关重要事项

国内两大AI巨头DeepSeek(深度求索)、寒武纪(688256)罕见同步发布相关重要事项。

DeepSeek官方微信号9月29日18:07发文称,“今天,我们正式发布 DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价,欢迎广大用户体验测试并向我们反馈意见。”

DeepSeek表示,“在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。目前API的模型版本为DeepSeek-V3.2-Exp,访问方式保持不变。”

仅仅4分钟后,即18:11,寒武纪(688256)旗下的微信公众号“寒武纪(688256)开发者”发布文章称:“2025年9月29日,寒武纪(688256)已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。代码地址和测试步骤见文末,开发者可以在寒武纪(688256)软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。”

寒武纪(688256)表示,公司一直高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模型。借助长期活跃的生态建设和技术积累,寒武纪(688256)得以快速实现对DeepSeek-V3.2-Exp这一全新实验性模型架构的day 0适配和优化。

寒武纪(688256)称,公司一直重视芯片和算法的联合创新,致力于以软硬件协同的方式,优化大模型部署性能,降低部署成本。

此前,寒武纪(688256)对DeepSeek系列模型进行了深入的软硬件协同性能优化,达成了业界领先的算力利用率水平。针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪(688256)通过Triton算子开发实现了快速适配,利用BangC融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。

“依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制,叠加寒武纪(688256)的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。”寒武纪(688256)强调。

在业内人士看来,此种同步发布适配的动作,表明中国AI产业链头部公司正在进行深度协同。这表明,或许早在DeepSeek-V3.2发布之前,寒武纪(688256)就在技术方面与DeepSeek进行沟通,并启动相关适配研发工作。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号-4
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈