DEEPTOPIC · AI大模型专题

DeepSeek API永久降价至1/4:全球大模型价格体系的重构,与国产算力链的系统性机会

V4-Pro缓存输入低至0.025元/百万tokens——仅为GPT-5.5同级模型的约1/700。这不是一次普通促销,是效率驱动的成本革命

核心结论:5月22日DeepSeek将V4-Pro API永久降至原价1/4,6月2日腾讯云跟降97.5%——10天内两轮降价宣告全球大模型定价体系进入不可逆的重构周期。与过往"烧钱抢份额"不同,本轮降价根源于MoE架构+国产算力适配带来的结构性成本优势,对手要追平需半年以上。受益确定性最高的方向是国产算力链:昇腾950下半年量产→DeepSeek吞吐扩张→芯片/服务器/光模块订单兑现,产业链正在从"主题等待"切换为"业绩兑现"。AI应用端成本骤降但竞争加剧,等场景独占者浮现。

产业链全景

从国产AI芯片到AI应用——DeepSeek降价沿这条链路逐环传导,每一环的受益逻辑与节奏不同。

DeepSeek降价国产算力产业链价值地图
图:DeepSeek降价国产算力产业链全景 — 上游芯片 → 算力服务器 → 算力云/生态集成 → 安全/应用

上游芯片与服务器环节受益确定性最高——V4架构"激活"了国产算力卡的集群能力,昇腾950下半年量产是最大催化剂。中游生态集成将芯片能力转化为企业级AI服务。下游应用仍在等风来:API成本骤降降低了入场门槛,但竞争加剧意味着只有场景独占型企业才能守住利润率。

受益标的

以下4家公司与DeepSeek降价→国产算力链兑现这条逻辑线绑定最深——从芯片到云服务,受益顺序按产业传导节奏排列。

01
缺口直达
DCU国产算力替代核心供应商
02
供应链锁定
昇腾服务器核心集成商
+23.71%
03
供应链锁定
天璇MaaS平台接入DeepSeek R1
04
最早兑现
DeepSeek-R1算力云服务商

一、全球最低价,仅为GPT同级1/700

5月22日,DeepSeek在官网宣布:V4-Pro模型API在5月31日结束限时2.5折优惠后,永久调整为原定价的1/4。仅隔10天——6月2日,腾讯云公告6月3日起将智能体开发平台上的DeepSeek-V4系列模型价格下调,最高降幅达97.5%。降价潮已从模型厂商烧到云平台,整个AI推理定价体系正在被系统性重写。

过去一个月,DeepSeek完成了罕见的"四连降":4月24日V4系列发布并开源 → 4月26日全系输入缓存价降至首发1/10 → 限时2.5折 → 如今直接永久定格在1/4。没有给对手任何反应时间。

0.025
缓存输入价/百万tokens
1/700
仅为GPT-5.5同级价格
99.86%
价格优势幅度

对比全球主流模型输入定价:DeepSeek V4-Pro缓存输入价仅为GPT-5.5 Pro同级模型的约1/700。同一天,国家发改委在发布会上表态"指导国产大模型加大力度适配国产算力芯片"——企业端"我能多便宜"和政策端"你得用国产"同天释放,信号叠加不是巧合。

全球主流大模型API输入价格对比(元/百万tokens,缓存命中场景)

数据来源:各厂商官网公告,2026年5月

二、价格打到地板,性能却冲上开源第一

V4-Pro总参数1.6万亿,激活参数490亿,整体性能对标全球顶级闭源模型;V4-Flash总参数2840亿,激活参数130亿,主打轻量化。两款均原生支持100万token超长上下文。

1.6万亿
V4-Pro总参数
490亿
V4-Pro激活参数
100
上下文长度(token)

Agentic Coding?评测中V4-Pro达到开源最佳水平。世界知识测评大幅领先其他开源模型,数学、STEM、竞赛型代码测评超越所有已公开评测的开源模型。DeepSeek不是"降价清库存"——它在性能全面领先开源领域的同时,把价格压到了全球最低。

三、降价不是烧钱——V4架构的效率账本

V4系列最核心的技术突破是Fine-Grained EP?。通过底层算子优化,把GPU间带宽需求降到了163-326GB/s——低于国产主力GPU的卡间互联带宽阈值。

163-326GB/s — V4架构下GPU间带宽需求,低于国产卡互联带宽阈值

此前被认为"互联性能不足"的国产算力卡,在V4新架构下被全面激活。DeepSeek首次在正式文档中将华为昇腾NPU与英伟达GPU并列写入硬件验证清单——不是做做样子,是技术层面已实现等同可用性。

另一项创新——KV Cache?滑窗+压缩算法——减少了Attention计算量和缓存体积。三层叠加:MoE?架构将激活参数降至490亿 → Fine-Grained EP把国产卡带宽门槛降至163GB/s → KV Cache压缩减少内存消耗,推理成本可能仅为密集模型的1/10到1/20。这才是0.025元的底牌——降价是果,效率是因。

不可逆的成本优势:竞争对手要追上这个价格,必须从模型架构层面做出同等幅度的效率提升——少则半年,多则一年以上。

四、国产算力替代——下半年还要再降

DeepSeek官方在降价公告中坦言:"受限于高端算力,目前Pro版本的服务吞吐较为有限,预计下半年昇腾950超节点批量上市后,Pro价格将大幅下调。"

V4-Pro完全运行在华为昇腾950PR推理芯片上,底层代码已从CUDA全面转向CANNNext?框架。华为昇腾、寒武纪、DCU?等8家国产AI芯片品牌在V4发布当天完成Day 0适配。DeepSeek将早期硬件访问权限优先授予国产厂商——这是战略上的主动站队。同时推进的700亿元人民币融资给了它足够弹药在吞吐受限的情况下先锁价、等量产。

五、对手跟降——谁的"真成本"扛得住?

DeepSeek把价格压到GPT同级1/700,国内对手没有选择只能跟。2026年Q1国产大模型API调用量同比增长约300%,但收入增速远低于此——关键问题是:谁在技术效率驱动成本下降,谁在用投资人的钱补贴收入?

+300%
API调用量同比增速
+80%
API收入同比增速

DeepSeek拥有MoE+Fine-Grained EP+KV压缩+国产算力四层成本优势。部分竞品依赖密集模型架构和通用算力——同样降价幅度,DeepSeek可能盈亏平衡,对手可能每调用一次就亏一次。行业正从"人人都能做"进入效率决定生死的出清阶段。

国产大模型API调用量增速 vs 收入增速(2026年Q1)

数据来源:IDC/行业估算,2026年Q1

六、两条链,一个收敛方向——A股该看谁?

DeepSeek降价的涟漪在A股沿两条线索传导。两条线索的受益窗口不同——一条正在兑现,一条还等风来。国产大模型越便宜→用的人越多→算力需求越大→国产芯片替代的紧迫性和商业价值越高。这是一个正反馈循环,发改委表态和DeepSeek的"昇腾优先"策略正在加速它。

线索一:国产算力链——当下吃肉

DeepSeek V4的Fine-Grained EP方案"激活"了国产算力卡。传导路径清晰:昇腾950超节点批量上市 → DeepSeek等服务吞吐量级扩张 → 国产芯片/服务器/交换机/光模块/液冷订单兑现。

01Fine-Grained EP将GPU带宽需求降至163-326GB/s→ 门槛化解
02华为昇腾/寒武纪/海光DCU完成Day 0适配→ 生态就绪
03昇腾950超节点下半年批量上市→ 供给释放
04DeepSeek等服务吞吐量级扩张→ 需求拉量
05芯片/服务器/交换机/光模块/液冷订单兑现→ 业绩兑现

这条线索的确定性来自"订单已经启动"——不是主题炒作,是产业链正在发生的真实采购。

线索二:AI应用端——等风来

API调用成本降至原来的零头,直接受益的是高频调用场景:AI客服、RAG?知识库、代码助手、文档分析、AI营销。传导路径:调用成本骤降 → 毛利率改善 → 功能升级加速 → 用户付费转化。但要注意:成本下降是全行业的普惠性利好,不是单一公司的护城河。

判断标准:不管哪家大模型API调用量增长,最终都要消耗算力——算力链是成本端确定性最高的方向。而应用端只有拥有场景独占性或数据壁垒的公司,才能在成本普惠中保持利润率。
环节位置核心企业(代码)当前状态
上游-芯片国产AI芯片海光信息(688041)DCU?适配完成
上游-算力服务器国产算力整机中科曙光(603019)订单增长
中游-算力云智算云服务并行科技(920493)扩张中
中游-生态集成昇腾生态集成软通动力(301236)放量
下游-安全AI安全安恒信息(688023)增长
下游-应用AI营销/Agent易点天下(301171)增长

七、如果国产算力掉链子了呢?

以下推演基于当前可观察事实,非预测。任何情景的兑现取决于驱动变量的实际走向。

情景一
如果昇腾950量产延期超过半年,DeepSeek V4-Pro吞吐将长期受限,国产算力链从"订单兑现"退回到"主题等待",市场给予的估值溢价可能消失。
情景二
如果互联网大厂依托云服务捆绑推出"API免费+增值收费"策略反制,DeepSeek的价格优势可能被对冲,独立大模型企业的商业化路径将收窄。
情景三
如果GPT-5.5或Claude通过架构优化大幅降价,国内外价差从700倍收窄至50倍以内,国产模型的"性价比"叙事可能被削弱。
情景四
如果AI应用端变现速度慢于调用量增速(如付费转化率持续低于5%),则只能证明"便宜≠有人用",AI应用端当前估值溢价可能面临回调。
⚠️
概率最高的路径
昇腾950在下半年实现批量上市(华为供应链工程确定性较高),V4-Pro服务能力从"较为有限"升级→价格继续下探→国产算力链订单进入兑现期→AI应用端用量持续增长但变现仍需1-2个季度验证。

核心参数对比

指标V4-ProV4-Flash
总参数1.6万亿2840亿
激活参数490亿130亿
上下文长度100万token100万token
架构MoE(混合专家)MoE(混合专家)
开源
缓存命中输入价0.025元/百万tokens
Agent能力开源最佳
国产算力适配8+品牌Day 0适配8+品牌Day 0适配

相关基金产品

ETF 产品
ETF名称代码题材相关性十大重仓股(与正文标的重合部分)
科创创业人工智能ETF景顺(159142) 159142 跟踪科创创业AI指数 新易盛 10.96%、澜起科技 10.15%、中际旭创 9.95%、寒武纪 7.0%
人工智能ETF万家(159248) 159248 跟踪人工智能指数 新易盛 11.42%、中际旭创 10.42%、寒武纪 7.23%
场外基金产品
基金名称代码近一年涨幅相关重仓股
长盛电子信息主题混合A(000063) 000063 +65.95% AI算力、电子信息产业链相关
华商计算机行业量化股票发起式A(007853) 007853 +27.37% 计算机、AI算力相关
想炒股先开户 优选券商,开户有好礼 立即开户 >>>
数据来源:DeepSeek官网公告、各厂商官网定价、国家发改委发布会、券商研报(中国银河等)、同花顺iFinD、同花顺问财、IDC/行业估算。