DEEPTOPIC · 算力基建专题

算力基建：Token工厂——AI时代的"发电厂"争夺战

140万亿Token/日、两年涨超千倍——算力正从"租卡"转向"卖Token"，估值逻辑也要跟着换

核心结论

核心结论：看好Token工厂环节。算力从裸金属出租转向按Token计费是结构性变天——Token工厂（弘信电子、润建股份）当前市场给的还是算力租赁估值，模式验证后估值中枢上移空间最大。三季度运营商Token套餐用户数是关键验证点。

A股关注弘信电子（300657） Token工厂标杆润建股份（002929）转向Token计费寒武纪（688256）国产AI芯片

140万亿

日均Token调用量（2026.3）

超千倍

两年Token消耗增长

1,133亿

海外四巨头单季资本开支（美元）

产业链全景

Token经济四层价值链：上游芯片设计壁垒最深，中游制造规模驱动、运营效率驱动，下游消费Token消耗驱动。从芯片→服务器→Token工厂→大模型应用，价值沿链逐层放大。

图：Token工厂全产业链图谱 — 芯片设计 → AI服务器/智算中心 → Token工厂/算力云 → 大模型/Agent应用

四层环节毛利率逐级攀升（芯片50-70% → 制造10-30% → 运营20-40% → 消费30-60%），但当前A股估值逻辑仍停留在"算力租赁"框架下——Token工厂环节的市场认知差最大。

一、大规模Token工厂，在无锡落地了

2026年5月15日，弘信电子（300657）和无锡高新区签了一个大规模Token工厂项目。

什么是Token工厂？以前的数据中心是"存文件的仓库"，Token工厂是"生产智能的工厂"。工业时代用电力度量能源、用"度"计价；AI时代的智能用Token度量，Token就是这个时代的"度"。

这个工厂的首期基建是一套华为昇腾384超节点算力集群——384张国产AI芯片组成一个超级计算机，是江苏省第一个同级别集群。而它要生产的"成品"，就是你每次用AI助手、调用大模型时消耗的Token。

几乎同一时间，中国电信推出了面向企业和个人的Token套餐，最低9.9元/月、最高299.9元/月；上海移动宣布推出Token通用服务，跨平台使用、话费结算。

4月27日，润建股份（002929）发布2025年年报，算力业务大幅增长，子公司五象云谷同月在深圳AI算力产业大会上宣布全面转型Token工厂——从裸金属出租转向按Token计费，已成为公开战略。

不到一个月，一份年报的算力增长数据、一家子公司的Token工厂宣言、一个签约、两个运营商套餐——Token经济从研报概念变成了财报、合同和套餐。

9.9元/月中国电信最低Token套餐价格 —— 和话费套餐一模一样，Token开始被当作消费品在卖

中国日均Token调用量增长轨迹

数据来源：国家数据局

但问题来了：Token消耗两年涨了超千倍，这背后是什么在驱动？谁来为这场算力黑洞买单？

二、两年涨了超千倍，这个算力黑洞谁来填？

140万亿Token/天 —— 按大模型API均价估算，相当于每天"烧掉"数亿元的算力消耗

是什么变了？答案是Agent（智能体）。

以前用AI，一问一答，消耗几百个Token。现在一个企业级AI Agent做一个市场计划，自己上网搜数据、读报告、整理表格、写PPT、群发邮件——这个流程不是一次调用，是几百次调用串联，Token消耗量是传统聊天的几百到上千倍。

不是用AI的人多了1000倍，是每个人每次用AI消耗的Token多了1000倍。

全球科技巨头资本开支（单季度）

数据来源：公司财报

国内这边，腾讯2026年一季度资本开支319亿元，同比增16%，环比增63%，创单季历史新高。腾讯高管在电话会上说——"今年下半年将有更多国产芯片陆续投入使用"。阿里在5月13日电话会上也给出了超预期的AI资本开支指引。

但供给端比需求端复杂得多。

英伟达H200、GB200能不能进中国，悬而未决。即便H200获准出口，国产替代的趋势也不会改变——因为推理场景中，国产芯片和H200的性能已经接近，而Token消耗的增量主要在推理端。

48%Blackwell芯片云端租赁价两个月涨幅 —— H100一年期租赁合约价也涨了近40%

供给在收紧，需求在井喷。这个剪刀差怎么收窄？答案指向了一个方向：国产芯片。

三、128GB拼141GB，国产芯的临门一脚

华为昇腾910C

128GB

显存 · 推理场景接近H200

英伟达H200

141GB

显存 · 训练场景大幅领先

华为昇腾910C，128GB显存。英伟达H200，141GB显存。推理场景中差距已经不大——因为推理的核心是显存容量和吞吐稳定性，不是单次计算速度。

但训练一个万亿参数的大模型，需要几千张芯片并行、高速互联、软件框架做复杂调度。英伟达在这块的护城河不是芯片本身——是积累了近二十年的CUDA生态，几百万人用了几百万行代码在上面写东西。

DeepSeek V4撕开了口子

2026年4月，DeepSeek V4发布——中国大模型第一次使用国产算力参与训练。华为昇腾参与了V4-Flash的部分训练，寒武纪（688256）实现了"Day 0适配"——模型发布当天就完成芯片适配、算子优化和代码开源。这个事件的意义不在技术参数上，而在信号意义上：国产算力从"能用"进入了"敢用"阶段。

黄仁勋自己也说："如果中国大模型率先跑在华为芯片上，对美国将是重大冲击。"

冷静看，目前国产芯片在推理端已经能打，但如果美国突然放松H200出口管制，替代紧迫性确实会下降。不过这只是短期扰动——能跑国产训练这件事本身已不可逆。

关键跟踪指标：下一个国产参与训练的大模型是谁？如果DeepSeek V5宣布100%用国产算力训练——那才是真正的引爆点。

四、从卖铲子到收电费——算力的包月转按次

先解释两个概念。裸金属就是直接租物理GPU——你有100张H100，租给别人按小时收钱，别人租去干什么、Token产出效率高不高，跟你没关系。赚的是租金差，跟房东一样。Token工厂不一样——同样的100张卡，你自己做推理优化、调度算法、模型适配，把算力"磨成"Token按用量卖给客户。比拼的不是"我有多少张卡"，而是"同样的电力和硬件，谁产出的Token更多更便宜"。

旧模式 · 裸金属租赁

租GPU卡

资产型业务 → 看PB和租金回报率

→

新模式 · Token工厂

按Token计费

运营型业务 → 看产能利用率和生产成本

算力租赁 = 房东

买房出租，赚租金差。先花大钱买卡建机房，慢慢收租金。盈利取决于上架率和租金差。

Token工厂 = 发电厂

发电卖电，按用量收钱。不租卡，直接把算力"磨成"Token卖给你。比拼的不是"我有多少张卡"，而是"固定电力功率下，每瓦产出多少高性能Token"。

Token运营商 = 电网公司

不发电，聚合调度收过路费。OpenRouter聚合60多家供应商、800多万用户，抽佣约5.5%，月Token服务量约80万亿。

看一个海外标杆——Fireworks AI。2022年成立，专注推理优化和Token生产。2026年2月年化收入3.15亿美元，毛利率约50%，最新融资估值40亿美元。核心竞争力在工程上——同样的硬件配置，Token产出更快、成本更低。

商业模式变了，估值逻辑就变了。国内押注这条路的玩家不少：润建股份（002929）在手订单230亿，年报明确转向按Token计费；弘信电子（300657）要跑"国产芯片+国产模型+按Token计费"全链条。转型不是改名——谁有工程团队、谁有模型适配经验、谁已经拿到了按Token计费的客户，这些才是甄别真假Token工厂的关键。

五、巨头抢芯片，运营商发套餐——谁会先出局？

现在是2026年5月，三条战线同时开打：

运营商下场卖Token

一旦Token和话费套餐打通——"199元套餐含100GB流量+5000万Token"——上游Token工厂的需求更加刚性，但定价权可能从工厂向运营商转移。

互联网巨头抢国产芯片

腾讯明确"下半年将有更多国产芯片投入使用"，阿里资本开支超预期。国产GPU流片产能在未来两三个季度被高度锁定，中小玩家拿不到卡。

AIDC集中交付

协创数据（300857）2025年服务器采购计划212亿，2026年2月追加110亿。宏景科技（301396）计划年内新增约3000P算力。润建股份（002929）在手订单230亿。全国同期在建智算中心超20个。

牌桌上的人越来越多，筹码越来越重。谁会先出局？

PPT算力签了框架协议但既无设备到货、也无客户签约、更无收入确认 —— 盯的不再是"订单公告"，而是"设备到货公告"和财报里的算力收入占比

裸金属降维Token工厂把单位成本打下来，直接买Token比租卡划算 —— 纯做裸金属的中小商最危险

芯片断供昇腾、寒武纪先进制程产能有限，巨头优先锁定 —— 没有产能锁定的租赁商，有客户有需求但没有卡

能留下来的，路径清晰：有产能锁定 + 有工程团队 + 有计费客户。

六、四层价值链，三种赚钱姿势——你站哪？

Token经济不是单一赛道，是一张四层价值分配图。

环节	位置	核心企业	利润特征	当前状态
上游-芯片	AI训练/推理芯片	寒武纪（688256）、海光信息（688041）	毛利率50-70%	推理端已能打，训练侧突破中
中游-制造	AI服务器+智算中心	中科曙光（603019）、弘信电子（300657）、润建股份（002929）	毛利率10-30%	AIDC集中交付，向Token计费转型
中游-运营	Token工厂/算力云	弘信电子（300657）、优刻得（688158）、首都在线（300846）	毛利率20-40%	Token工厂模式初步落地
下游-消费	大模型/Agent/企业AI	MiniMax、智谱、科大讯飞（002230）	毛利率30-60%	API调用量爆发

确定性路线 → 芯片层

寒武纪（688256）、海光信息（688041）。赚的是替代从50%到100%的钱，不是从0到50%。不管下游什么模式都得买芯片。但估值已充分反映预期，业绩兑现是最大考验。

估值差路线 → Token工厂层

弘信电子（300657）、润建股份（002929）。当前市场给的还是算力租赁估值，Token工厂模式验证后估值中枢会上移——对标Fireworks AI的40亿美元估值。

弹性路线 → 交付期中小标的

宏景科技（301396）、协创数据（300857）。弹性大但波动大，紧密跟踪设备到货和收入确认。"PPT订单"是行业最大隐雷。

七、如果剧本不按这个走呢？

美国放松H200出口

短期缓解替代紧迫性，但DeepSeek V4已证明国产可以训，趋势不可逆。

Token需求增速大幅回落

Agent商业化不及预期，Token消耗从三位数增速回落到两位数，工厂产能利用率和定价承压。

国产芯片训练效率长期无法追平

推理和训练市场割裂，训练侧国产替代逻辑受损。

电力瓶颈

单AIDC动辄数十兆瓦，在东数西算算电协同落地前电力供给可能成为硬约束。

"PPT订单"违约潮

景气时签的框架协议，下行时集中违约。甄别真交付和假框架是第一风控动作。

ETF名称	代码	题材相关性	十大重仓股（与正文标的重合部分）
人工智能ETF万家（159248）	159248	紧密跟踪人工智能主题指数	寒武纪（688256）、中科曙光（603019）、科大讯飞（002230）
科创创业人工智能ETF景顺（159142）	159142	紧密跟踪科创创业人工智能指数	寒武纪（688256）、协创数据（300857）

基金名称	代码	近一年涨幅	相关重仓股
长盛电子信息主题混合A（000063）	000063	+51.00%	算力基建相关标的
华商计算机行业量化股票发起式A（007853）	007853	+21.84%	计算机行业相关标的