DeepSeek API永久降价至1/4:全球大模型价格体系的重构,与国产算力链的系统性机会
核心结论:5月22日DeepSeek将V4-Pro API永久降至原价1/4,6月2日腾讯云跟降97.5%——10天内两轮降价宣告全球大模型定价体系进入不可逆的重构周期。与过往"烧钱抢份额"不同,本轮降价根源于MoE架构+国产算力适配带来的结构性成本优势,对手要追平需半年以上。受益确定性最高的方向是国产算力链:昇腾950下半年量产→DeepSeek吞吐扩张→芯片/服务器/光模块订单兑现,产业链正在从"主题等待"切换为"业绩兑现"。AI应用端成本骤降但竞争加剧,等场景独占者浮现。
产业链全景
从国产AI芯片到AI应用——DeepSeek降价沿这条链路逐环传导,每一环的受益逻辑与节奏不同。
上游芯片与服务器环节受益确定性最高——V4架构"激活"了国产算力卡的集群能力,昇腾950下半年量产是最大催化剂。中游生态集成将芯片能力转化为企业级AI服务。下游应用仍在等风来:API成本骤降降低了入场门槛,但竞争加剧意味着只有场景独占型企业才能守住利润率。
一、全球最低价,仅为GPT同级1/700
5月22日,DeepSeek在官网宣布:V4-Pro模型API在5月31日结束限时2.5折优惠后,永久调整为原定价的1/4。仅隔10天——6月2日,腾讯云公告6月3日起将智能体开发平台上的DeepSeek-V4系列模型价格下调,最高降幅达97.5%。降价潮已从模型厂商烧到云平台,整个AI推理定价体系正在被系统性重写。
过去一个月,DeepSeek完成了罕见的"四连降":4月24日V4系列发布并开源 → 4月26日全系输入缓存价降至首发1/10 → 限时2.5折 → 如今直接永久定格在1/4。没有给对手任何反应时间。
对比全球主流模型输入定价:DeepSeek V4-Pro缓存输入价仅为GPT-5.5 Pro同级模型的约1/700。同一天,国家发改委在发布会上表态"指导国产大模型加大力度适配国产算力芯片"——企业端"我能多便宜"和政策端"你得用国产"同天释放,信号叠加不是巧合。
全球主流大模型API输入价格对比(元/百万tokens,缓存命中场景)
二、价格打到地板,性能却冲上开源第一
V4-Pro总参数1.6万亿,激活参数490亿,整体性能对标全球顶级闭源模型;V4-Flash总参数2840亿,激活参数130亿,主打轻量化。两款均原生支持100万token超长上下文。
在Agentic Coding评测中V4-Pro达到开源最佳水平。世界知识测评大幅领先其他开源模型,数学、STEM、竞赛型代码测评超越所有已公开评测的开源模型。DeepSeek不是"降价清库存"——它在性能全面领先开源领域的同时,把价格压到了全球最低。
V4-Pro的Agentic Coding使用体验已优于Claude Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式。世界知识测评仅稍逊于顶级闭源模型Gemini-Pro-3.1。V4-Flash总参数2840亿、激活参数130亿,专为轻量化高性价比场景设计,在同等参数规模的开源模型中表现领先。
三、降价不是烧钱——V4架构的效率账本
V4系列最核心的技术突破是Fine-Grained EP。通过底层算子优化,把GPU间带宽需求降到了163-326GB/s——低于国产主力GPU的卡间互联带宽阈值。
此前被认为"互联性能不足"的国产算力卡,在V4新架构下被全面激活。DeepSeek首次在正式文档中将华为昇腾NPU与英伟达GPU并列写入硬件验证清单——不是做做样子,是技术层面已实现等同可用性。
另一项创新——KV Cache滑窗+压缩算法——减少了Attention计算量和缓存体积。三层叠加:MoE架构将激活参数降至490亿 → Fine-Grained EP把国产卡带宽门槛降至163GB/s → KV Cache压缩减少内存消耗,推理成本可能仅为密集模型的1/10到1/20。这才是0.025元的底牌——降价是果,效率是因。
不可逆的成本优势:竞争对手要追上这个价格,必须从模型架构层面做出同等幅度的效率提升——少则半年,多则一年以上。
四、国产算力替代——下半年还要再降
DeepSeek官方在降价公告中坦言:"受限于高端算力,目前Pro版本的服务吞吐较为有限,预计下半年昇腾950超节点批量上市后,Pro价格将大幅下调。"
V4-Pro完全运行在华为昇腾950PR推理芯片上,底层代码已从CUDA全面转向CANNNext框架。华为昇腾、寒武纪、DCU等8家国产AI芯片品牌在V4发布当天完成Day 0适配。DeepSeek将早期硬件访问权限优先授予国产厂商——这是战略上的主动站队。同时推进的700亿元人民币融资给了它足够弹药在吞吐受限的情况下先锁价、等量产。
五、对手跟降——谁的"真成本"扛得住?
DeepSeek把价格压到GPT同级1/700,国内对手没有选择只能跟。2026年Q1国产大模型API调用量同比增长约300%,但收入增速远低于此——关键问题是:谁在技术效率驱动成本下降,谁在用投资人的钱补贴收入?
DeepSeek拥有MoE+Fine-Grained EP+KV压缩+国产算力四层成本优势。部分竞品依赖密集模型架构和通用算力——同样降价幅度,DeepSeek可能盈亏平衡,对手可能每调用一次就亏一次。行业正从"人人都能做"进入效率决定生死的出清阶段。
国产大模型API调用量增速 vs 收入增速(2026年Q1)
六、两条链,一个收敛方向——A股该看谁?
DeepSeek降价的涟漪在A股沿两条线索传导。两条线索的受益窗口不同——一条正在兑现,一条还等风来。国产大模型越便宜→用的人越多→算力需求越大→国产芯片替代的紧迫性和商业价值越高。这是一个正反馈循环,发改委表态和DeepSeek的"昇腾优先"策略正在加速它。
线索一:国产算力链——当下吃肉
DeepSeek V4的Fine-Grained EP方案"激活"了国产算力卡。传导路径清晰:昇腾950超节点批量上市 → DeepSeek等服务吞吐量级扩张 → 国产芯片/服务器/交换机/光模块/液冷订单兑现。
这条线索的确定性来自"订单已经启动"——不是主题炒作,是产业链正在发生的真实采购。
线索二:AI应用端——等风来
API调用成本降至原来的零头,直接受益的是高频调用场景:AI客服、RAG知识库、代码助手、文档分析、AI营销。传导路径:调用成本骤降 → 毛利率改善 → 功能升级加速 → 用户付费转化。但要注意:成本下降是全行业的普惠性利好,不是单一公司的护城河。
判断标准:不管哪家大模型API调用量增长,最终都要消耗算力——算力链是成本端确定性最高的方向。而应用端只有拥有场景独占性或数据壁垒的公司,才能在成本普惠中保持利润率。
| 环节 | 位置 | 核心企业(代码) | 当前状态 |
|---|---|---|---|
| 上游-芯片 | 国产AI芯片 | 海光信息(688041) | DCU适配完成 |
| 上游-算力服务器 | 国产算力整机 | 中科曙光(603019) | 订单增长 |
| 中游-算力云 | 智算云服务 | 并行科技(920493) | 扩张中 |
| 中游-生态集成 | 昇腾生态集成 | 软通动力(301236) | 放量 |
| 下游-安全 | AI安全 | 安恒信息(688023) | 增长 |
| 下游-应用 | AI营销/Agent | 易点天下(301171) | 增长 |
七、如果国产算力掉链子了呢?
以下推演基于当前可观察事实,非预测。任何情景的兑现取决于驱动变量的实际走向。
核心参数对比
| 指标 | V4-Pro | V4-Flash |
|---|---|---|
| 总参数 | 1.6万亿 | 2840亿 |
| 激活参数 | 490亿 | 130亿 |
| 上下文长度 | 100万token | 100万token |
| 架构 | MoE(混合专家) | MoE(混合专家) |
| 开源 | 是 | 是 |
| 缓存命中输入价 | 0.025元/百万tokens | — |
| Agent能力 | 开源最佳 | — |
| 国产算力适配 | 8+品牌Day 0适配 | 8+品牌Day 0适配 |
相关基金产品
| ETF名称 | 代码 | 题材相关性 | 十大重仓股(与正文标的重合部分) |
|---|---|---|---|
| 科创创业人工智能ETF景顺(159142) | 159142 | 跟踪科创创业AI指数 | 新易盛 10.96%、澜起科技 10.15%、中际旭创 9.95%、寒武纪 7.0% |
| 人工智能ETF万家(159248) | 159248 | 跟踪人工智能指数 | 新易盛 11.42%、中际旭创 10.42%、寒武纪 7.23% |
| 基金名称 | 代码 | 近一年涨幅 | 相关重仓股 |
|---|---|---|---|
| 长盛电子信息主题混合A(000063) | 000063 | +65.95% | AI算力、电子信息产业链相关 |
| 华商计算机行业量化股票发起式A(007853) | 007853 | +27.37% | 计算机、AI算力相关 |