DEEPTOPIC · AI大模型专题

DeepSeek API永久降价至1/4：全球大模型价格体系的重构，与国产算力链的系统性机会

V4-Pro缓存输入低至0.025元/百万tokens——仅为GPT-5.5同级模型的约1/700。这不是一次普通促销，是效率驱动的成本革命

核心结论：5月22日DeepSeek将V4-Pro API永久降至原价1/4，6月2日腾讯云跟降97.5%——10天内两轮降价宣告全球大模型定价体系进入不可逆的重构周期。与过往"烧钱抢份额"不同，本轮降价根源于MoE架构+国产算力适配带来的结构性成本优势，对手要追平需半年以上。受益确定性最高的方向是国产算力链：昇腾950下半年量产→DeepSeek吞吐扩张→芯片/服务器/光模块订单兑现，产业链正在从"主题等待"切换为"业绩兑现"。AI应用端成本骤降但竞争加剧，等场景独占者浮现。

产业链全景

从国产AI芯片到AI应用——DeepSeek降价沿这条链路逐环传导，每一环的受益逻辑与节奏不同。

上游芯片与服务器环节受益确定性最高——V4架构"激活"了国产算力卡的集群能力，昇腾950下半年量产是最大催化剂。中游生态集成将芯片能力转化为企业级AI服务。下游应用仍在等风来：API成本骤降降低了入场门槛，但竞争加剧意味着只有场景独占型企业才能守住利润率。

受益标的

以下4家公司与DeepSeek降价→国产算力链兑现这条逻辑线绑定最深——从芯片到云服务，受益顺序按产业传导节奏排列。

海光信息688041

缺口直达

DCU国产算力替代核心供应商

中科曙光603019

供应链锁定

昇腾服务器核心集成商

+23.71%

软通动力301236

供应链锁定

天璇MaaS平台接入DeepSeek R1

并行科技920493

最早兑现

DeepSeek-R1算力云服务商

一、全球最低价，仅为GPT同级1/700

5月22日，DeepSeek在官网宣布：V4-Pro模型API在5月31日结束限时2.5折优惠后，永久调整为原定价的1/4。仅隔10天——6月2日，腾讯云公告6月3日起将智能体开发平台上的DeepSeek-V4系列模型价格下调，最高降幅达97.5%。降价潮已从模型厂商烧到云平台，整个AI推理定价体系正在被系统性重写。

过去一个月，DeepSeek完成了罕见的"四连降"：4月24日V4系列发布并开源 → 4月26日全系输入缓存价降至首发1/10 → 限时2.5折 → 如今直接永久定格在1/4。没有给对手任何反应时间。

0.025元

缓存输入价/百万tokens

1/700

仅为GPT-5.5同级价格

99.86%

价格优势幅度

对比全球主流模型输入定价：DeepSeek V4-Pro缓存输入价仅为GPT-5.5 Pro同级模型的约1/700。同一天，国家发改委在发布会上表态"指导国产大模型加大力度适配国产算力芯片"——企业端"我能多便宜"和政策端"你得用国产"同天释放，信号叠加不是巧合。

全球主流大模型API输入价格对比（元/百万tokens，缓存命中场景）

数据来源：各厂商官网公告，2026年5月

二、价格打到地板，性能却冲上开源第一

V4-Pro总参数1.6万亿，激活参数490亿，整体性能对标全球顶级闭源模型；V4-Flash总参数2840亿，激活参数130亿，主打轻量化。两款均原生支持100万token超长上下文。

1.6万亿

V4-Pro总参数

490亿

V4-Pro激活参数

100万

上下文长度（token）

在Agentic Coding?评测中V4-Pro达到开源最佳水平。世界知识测评大幅领先其他开源模型，数学、STEM、竞赛型代码测评超越所有已公开评测的开源模型。DeepSeek不是"降价清库存"——它在性能全面领先开源领域的同时，把价格压到了全球最低。

三、降价不是烧钱——V4架构的效率账本

V4系列最核心的技术突破是Fine-Grained EP?。通过底层算子优化，把GPU间带宽需求降到了163-326GB/s——低于国产主力GPU的卡间互联带宽阈值。

163-326GB/s — V4架构下GPU间带宽需求，低于国产卡互联带宽阈值

此前被认为"互联性能不足"的国产算力卡，在V4新架构下被全面激活。DeepSeek首次在正式文档中将华为昇腾NPU与英伟达GPU并列写入硬件验证清单——不是做做样子，是技术层面已实现等同可用性。

另一项创新——KV Cache?滑窗+压缩算法——减少了Attention计算量和缓存体积。三层叠加：MoE?架构将激活参数降至490亿 → Fine-Grained EP把国产卡带宽门槛降至163GB/s → KV Cache压缩减少内存消耗，推理成本可能仅为密集模型的1/10到1/20。这才是0.025元的底牌——降价是果，效率是因。

不可逆的成本优势：竞争对手要追上这个价格，必须从模型架构层面做出同等幅度的效率提升——少则半年，多则一年以上。

四、国产算力替代——下半年还要再降

DeepSeek官方在降价公告中坦言："受限于高端算力，目前Pro版本的服务吞吐较为有限，预计下半年昇腾950超节点批量上市后，Pro价格将大幅下调。"

V4-Pro完全运行在华为昇腾950PR推理芯片上，底层代码已从CUDA全面转向CANNNext?框架。华为昇腾、寒武纪、DCU?等8家国产AI芯片品牌在V4发布当天完成Day 0适配。DeepSeek将早期硬件访问权限优先授予国产厂商——这是战略上的主动站队。同时推进的700亿元人民币融资给了它足够弹药在吞吐受限的情况下先锁价、等量产。

五、对手跟降——谁的"真成本"扛得住？

DeepSeek把价格压到GPT同级1/700，国内对手没有选择只能跟。2026年Q1国产大模型API调用量同比增长约300%，但收入增速远低于此——关键问题是：谁在技术效率驱动成本下降，谁在用投资人的钱补贴收入？

+300%

API调用量同比增速

+80%

API收入同比增速

DeepSeek拥有MoE+Fine-Grained EP+KV压缩+国产算力四层成本优势。部分竞品依赖密集模型架构和通用算力——同样降价幅度，DeepSeek可能盈亏平衡，对手可能每调用一次就亏一次。行业正从"人人都能做"进入效率决定生死的出清阶段。

国产大模型API调用量增速 vs 收入增速（2026年Q1）

数据来源：IDC/行业估算，2026年Q1

六、两条链，一个收敛方向——A股该看谁？

DeepSeek降价的涟漪在A股沿两条线索传导。两条线索的受益窗口不同——一条正在兑现，一条还等风来。国产大模型越便宜→用的人越多→算力需求越大→国产芯片替代的紧迫性和商业价值越高。这是一个正反馈循环，发改委表态和DeepSeek的"昇腾优先"策略正在加速它。

线索一：国产算力链——当下吃肉

DeepSeek V4的Fine-Grained EP方案"激活"了国产算力卡。传导路径清晰：昇腾950超节点批量上市 → DeepSeek等服务吞吐量级扩张 → 国产芯片/服务器/交换机/光模块/液冷订单兑现。

01Fine-Grained EP将GPU带宽需求降至163-326GB/s→ 门槛化解

02华为昇腾/寒武纪/海光DCU完成Day 0适配→ 生态就绪

03昇腾950超节点下半年批量上市→ 供给释放

04DeepSeek等服务吞吐量级扩张→ 需求拉量

05芯片/服务器/交换机/光模块/液冷订单兑现→ 业绩兑现

这条线索的确定性来自"订单已经启动"——不是主题炒作，是产业链正在发生的真实采购。

线索二：AI应用端——等风来

API调用成本降至原来的零头，直接受益的是高频调用场景：AI客服、RAG?知识库、代码助手、文档分析、AI营销。传导路径：调用成本骤降 → 毛利率改善 → 功能升级加速 → 用户付费转化。但要注意：成本下降是全行业的普惠性利好，不是单一公司的护城河。

判断标准：不管哪家大模型API调用量增长，最终都要消耗算力——算力链是成本端确定性最高的方向。而应用端只有拥有场景独占性或数据壁垒的公司，才能在成本普惠中保持利润率。

环节	位置	核心企业（代码）	当前状态
上游-芯片	国产AI芯片	海光信息（688041）	DCU?适配完成
上游-算力服务器	国产算力整机	中科曙光（603019）	订单增长
中游-算力云	智算云服务	并行科技（920493）	扩张中
中游-生态集成	昇腾生态集成	软通动力（301236）	放量
下游-安全	AI安全	安恒信息（688023）	增长
下游-应用	AI营销/Agent	易点天下（301171）	增长

七、如果国产算力掉链子了呢？

以下推演基于当前可观察事实，非预测。任何情景的兑现取决于驱动变量的实际走向。

情景一

如果昇腾950量产延期超过半年，DeepSeek V4-Pro吞吐将长期受限，国产算力链从"订单兑现"退回到"主题等待"，市场给予的估值溢价可能消失。

情景二

如果互联网大厂依托云服务捆绑推出"API免费+增值收费"策略反制，DeepSeek的价格优势可能被对冲，独立大模型企业的商业化路径将收窄。

情景三

如果GPT-5.5或Claude通过架构优化大幅降价，国内外价差从700倍收窄至50倍以内，国产模型的"性价比"叙事可能被削弱。

情景四

如果AI应用端变现速度慢于调用量增速（如付费转化率持续低于5%），则只能证明"便宜≠有人用"，AI应用端当前估值溢价可能面临回调。

⚠️

概率最高的路径

昇腾950在下半年实现批量上市（华为供应链工程确定性较高），V4-Pro服务能力从"较为有限"升级→价格继续下探→国产算力链订单进入兑现期→AI应用端用量持续增长但变现仍需1-2个季度验证。

核心参数对比

指标	V4-Pro	V4-Flash
总参数	1.6万亿	2840亿
激活参数	490亿	130亿
上下文长度	100万token	100万token
架构	MoE（混合专家）	MoE（混合专家）
开源	是	是
缓存命中输入价	0.025元/百万tokens	—
Agent能力	开源最佳	—
国产算力适配	8+品牌Day 0适配	8+品牌Day 0适配

ETF名称	代码	题材相关性	十大重仓股（与正文标的重合部分）
科创创业人工智能ETF景顺（159142）	159142	跟踪科创创业AI指数	新易盛 10.96%、澜起科技 10.15%、中际旭创 9.95%、寒武纪 7.0%
人工智能ETF万家（159248）	159248	跟踪人工智能指数	新易盛 11.42%、中际旭创 10.42%、寒武纪 7.23%

基金名称	代码	近一年涨幅	相关重仓股
长盛电子信息主题混合A（000063）	000063	+65.95%	AI算力、电子信息产业链相关
华商计算机行业量化股票发起式A（007853）	007853	+27.37%	计算机、AI算力相关