DEEPTOPIC · 算力基建专题

算力基建:Token工厂——AI时代的"发电厂"争夺战

140万亿Token/日、两年涨超千倍——算力正从"租卡"转向"卖Token",估值逻辑也要跟着换
核心结论

核心结论:看好Token工厂环节。算力从裸金属出租转向按Token计费是结构性变天——Token工厂(弘信电子、润建股份)当前市场给的还是算力租赁估值,模式验证后估值中枢上移空间最大。三季度运营商Token套餐用户数是关键验证点。

A股关注 弘信电子(300657) Token工厂标杆 润建股份(002929) 转向Token计费 寒武纪(688256) 国产AI芯片
140万亿
日均Token调用量(2026.3)
超千倍
两年Token消耗增长
1,133亿
海外四巨头单季资本开支(美元)
产业链全景

Token经济四层价值链:上游芯片设计壁垒最深,中游制造规模驱动、运营效率驱动,下游消费Token消耗驱动。从芯片→服务器→Token工厂→大模型应用,价值沿链逐层放大。

算力基建Token工厂全产业链流程图谱
图:Token工厂全产业链图谱 — 芯片设计 → AI服务器/智算中心 → Token工厂/算力云 → 大模型/Agent应用

四层环节毛利率逐级攀升(芯片50-70% → 制造10-30% → 运营20-40% → 消费30-60%),但当前A股估值逻辑仍停留在"算力租赁"框架下——Token工厂环节的市场认知差最大。

一、大规模Token工厂,在无锡落地了

2026年5月15日,弘信电子(300657)和无锡高新区签了一个大规模Token工厂项目。

什么是Token工厂?以前的数据中心是"存文件的仓库",Token工厂是"生产智能的工厂"。工业时代用电力度量能源、用"度"计价;AI时代的智能用Token度量,Token就是这个时代的"度"。

这个工厂的首期基建是一套华为昇腾384超节点算力集群——384张国产AI芯片组成一个超级计算机,是江苏省第一个同级别集群。而它要生产的"成品",就是你每次用AI助手、调用大模型时消耗的Token。

几乎同一时间,中国电信推出了面向企业和个人的Token套餐,最低9.9元/月、最高299.9元/月;上海移动宣布推出Token通用服务,跨平台使用、话费结算。

4月27日,润建股份(002929)发布2025年年报,算力业务大幅增长,子公司五象云谷同月在深圳AI算力产业大会上宣布全面转型Token工厂——从裸金属出租转向按Token计费,已成为公开战略。

不到一个月,一份年报的算力增长数据、一家子公司的Token工厂宣言、一个签约、两个运营商套餐——Token经济从研报概念变成了财报、合同和套餐。

9.9元/月中国电信最低Token套餐价格 —— 和话费套餐一模一样,Token开始被当作消费品在卖

中国日均Token调用量增长轨迹

数据来源:国家数据局

但问题来了:Token消耗两年涨了超千倍,这背后是什么在驱动?谁来为这场算力黑洞买单?

二、两年涨了超千倍,这个算力黑洞谁来填?
140万亿Token/天 —— 按大模型API均价估算,相当于每天"烧掉"数亿元的算力消耗

是什么变了?答案是Agent(智能体)

以前用AI,一问一答,消耗几百个Token。现在一个企业级AI Agent做一个市场计划,自己上网搜数据、读报告、整理表格、写PPT、群发邮件——这个流程不是一次调用,是几百次调用串联,Token消耗量是传统聊天的几百到上千倍。

不是用AI的人多了1000倍,是每个人每次用AI消耗的Token多了1000倍

全球科技巨头资本开支(单季度)

数据来源:公司财报

国内这边,腾讯2026年一季度资本开支319亿元,同比增16%,环比增63%,创单季历史新高。腾讯高管在电话会上说——"今年下半年将有更多国产芯片陆续投入使用"。阿里在5月13日电话会上也给出了超预期的AI资本开支指引。

但供给端比需求端复杂得多。

英伟达H200、GB200能不能进中国,悬而未决。即便H200获准出口,国产替代的趋势也不会改变——因为推理场景中,国产芯片和H200的性能已经接近,而Token消耗的增量主要在推理端。

48%Blackwell芯片云端租赁价两个月涨幅 —— H100一年期租赁合约价也涨了近40%

供给在收紧,需求在井喷。这个剪刀差怎么收窄?答案指向了一个方向:国产芯片。

三、128GB拼141GB,国产芯的临门一脚
华为昇腾910C
128GB
显存 · 推理场景接近H200
VS
英伟达H200
141GB
显存 · 训练场景大幅领先

华为昇腾910C,128GB显存。英伟达H200,141GB显存。推理场景中差距已经不大——因为推理的核心是显存容量和吞吐稳定性,不是单次计算速度。

但训练一个万亿参数的大模型,需要几千张芯片并行、高速互联、软件框架做复杂调度。英伟达在这块的护城河不是芯片本身——是积累了近二十年的CUDA生态,几百万人用了几百万行代码在上面写东西。

!
DeepSeek V4撕开了口子

2026年4月,DeepSeek V4发布——中国大模型第一次使用国产算力参与训练。华为昇腾参与了V4-Flash的部分训练,寒武纪(688256)实现了"Day 0适配"——模型发布当天就完成芯片适配、算子优化和代码开源。这个事件的意义不在技术参数上,而在信号意义上:国产算力从"能用"进入了"敢用"阶段。

黄仁勋自己也说:"如果中国大模型率先跑在华为芯片上,对美国将是重大冲击。"

冷静看,目前国产芯片在推理端已经能打,但如果美国突然放松H200出口管制,替代紧迫性确实会下降。不过这只是短期扰动——能跑国产训练这件事本身已不可逆。

关键跟踪指标:下一个国产参与训练的大模型是谁?如果DeepSeek V5宣布100%用国产算力训练——那才是真正的引爆点。
四、从卖铲子到收电费——算力的包月转按次

先解释两个概念。裸金属就是直接租物理GPU——你有100张H100,租给别人按小时收钱,别人租去干什么、Token产出效率高不高,跟你没关系。赚的是租金差,跟房东一样。Token工厂不一样——同样的100张卡,你自己做推理优化、调度算法、模型适配,把算力"磨成"Token按用量卖给客户。比拼的不是"我有多少张卡",而是"同样的电力和硬件,谁产出的Token更多更便宜"。

旧模式 · 裸金属租赁
租GPU卡
资产型业务 → 看PB和租金回报率
新模式 · Token工厂
按Token计费
运营型业务 → 看产能利用率和生产成本
1
算力租赁 = 房东

买房出租,赚租金差。先花大钱买卡建机房,慢慢收租金。盈利取决于上架率和租金差。

2
Token工厂 = 发电厂

发电卖电,按用量收钱。不租卡,直接把算力"磨成"Token卖给你。比拼的不是"我有多少张卡",而是"固定电力功率下,每瓦产出多少高性能Token"。

3
Token运营商 = 电网公司

不发电,聚合调度收过路费。OpenRouter聚合60多家供应商、800多万用户,抽佣约5.5%,月Token服务量约80万亿。

看一个海外标杆——Fireworks AI。2022年成立,专注推理优化和Token生产。2026年2月年化收入3.15亿美元,毛利率约50%,最新融资估值40亿美元。核心竞争力在工程上——同样的硬件配置,Token产出更快、成本更低。

商业模式变了,估值逻辑就变了。国内押注这条路的玩家不少:润建股份(002929)在手订单230亿,年报明确转向按Token计费;弘信电子(300657)要跑"国产芯片+国产模型+按Token计费"全链条。转型不是改名——谁有工程团队、谁有模型适配经验、谁已经拿到了按Token计费的客户,这些才是甄别真假Token工厂的关键。

五、巨头抢芯片,运营商发套餐——谁会先出局?

现在是2026年5月,三条战线同时开打:

1
运营商下场卖Token

一旦Token和话费套餐打通——"199元套餐含100GB流量+5000万Token"——上游Token工厂的需求更加刚性,但定价权可能从工厂向运营商转移。

2
互联网巨头抢国产芯片

腾讯明确"下半年将有更多国产芯片投入使用",阿里资本开支超预期。国产GPU流片产能在未来两三个季度被高度锁定,中小玩家拿不到卡。

3
AIDC集中交付

协创数据(300857)2025年服务器采购计划212亿,2026年2月追加110亿。宏景科技(301396)计划年内新增约3000P算力。润建股份(002929)在手订单230亿。全国同期在建智算中心超20个。

牌桌上的人越来越多,筹码越来越重。谁会先出局?

PPT算力签了框架协议但既无设备到货、也无客户签约、更无收入确认 —— 盯的不再是"订单公告",而是"设备到货公告"和财报里的算力收入占比
裸金属降维Token工厂把单位成本打下来,直接买Token比租卡划算 —— 纯做裸金属的中小商最危险
芯片断供昇腾、寒武纪先进制程产能有限,巨头优先锁定 —— 没有产能锁定的租赁商,有客户有需求但没有卡
能留下来的,路径清晰:有产能锁定 + 有工程团队 + 有计费客户。
六、四层价值链,三种赚钱姿势——你站哪?

Token经济不是单一赛道,是一张四层价值分配图。

环节位置核心企业利润特征当前状态
上游-芯片AI训练/推理芯片寒武纪(688256)海光信息(688041)毛利率50-70%推理端已能打,训练侧突破中
中游-制造AI服务器+智算中心中科曙光(603019)弘信电子(300657)润建股份(002929)毛利率10-30%AIDC集中交付,向Token计费转型
中游-运营Token工厂/算力云弘信电子(300657)优刻得(688158)首都在线(300846)毛利率20-40%Token工厂模式初步落地
下游-消费大模型/Agent/企业AIMiniMax、智谱、科大讯飞(002230)毛利率30-60%API调用量爆发
1
确定性路线 → 芯片层

寒武纪(688256)海光信息(688041)。赚的是替代从50%到100%的钱,不是从0到50%。不管下游什么模式都得买芯片。但估值已充分反映预期,业绩兑现是最大考验。

2
估值差路线 → Token工厂层

弘信电子(300657)润建股份(002929)。当前市场给的还是算力租赁估值,Token工厂模式验证后估值中枢会上移——对标Fireworks AI的40亿美元估值。

3
弹性路线 → 交付期中小标的

宏景科技(301396)协创数据(300857)。弹性大但波动大,紧密跟踪设备到货和收入确认。"PPT订单"是行业最大隐雷。

七、如果剧本不按这个走呢?
美国放松H200出口

短期缓解替代紧迫性,但DeepSeek V4已证明国产可以训,趋势不可逆。

Token需求增速大幅回落

Agent商业化不及预期,Token消耗从三位数增速回落到两位数,工厂产能利用率和定价承压。

国产芯片训练效率长期无法追平

推理和训练市场割裂,训练侧国产替代逻辑受损。

电力瓶颈

单AIDC动辄数十兆瓦,在东数西算算电协同落地前电力供给可能成为硬约束。

"PPT订单"违约潮

景气时签的框架协议,下行时集中违约。甄别真交付和假框架是第一风控动作。

相关基金产品
ETF 产品
ETF名称代码题材相关性十大重仓股(与正文标的重合部分)
人工智能ETF万家(159248) 159248 紧密跟踪人工智能主题指数 寒武纪(688256)中科曙光(603019)科大讯飞(002230)
科创创业人工智能ETF景顺(159142) 159142 紧密跟踪科创创业人工智能指数 寒武纪(688256)协创数据(300857)
场外基金产品
基金名称代码近一年涨幅相关重仓股
长盛电子信息主题混合A(000063) 000063 +51.00% 算力基建相关标的
华商计算机行业量化股票发起式A(007853) 007853 +21.84% 计算机行业相关标的
更多AI算力产业链机会,把握Token经济投资机遇 开通同花顺证券账户 · 极速交易通道