算力基建:Token工厂——AI时代的"发电厂"争夺战
核心结论:看好Token工厂环节。算力从裸金属出租转向按Token计费是结构性变天——Token工厂(弘信电子、润建股份)当前市场给的还是算力租赁估值,模式验证后估值中枢上移空间最大。三季度运营商Token套餐用户数是关键验证点。
Token经济四层价值链:上游芯片设计壁垒最深,中游制造规模驱动、运营效率驱动,下游消费Token消耗驱动。从芯片→服务器→Token工厂→大模型应用,价值沿链逐层放大。
四层环节毛利率逐级攀升(芯片50-70% → 制造10-30% → 运营20-40% → 消费30-60%),但当前A股估值逻辑仍停留在"算力租赁"框架下——Token工厂环节的市场认知差最大。
2026年5月15日,弘信电子(300657)和无锡高新区签了一个大规模Token工厂项目。
什么是Token工厂?以前的数据中心是"存文件的仓库",Token工厂是"生产智能的工厂"。工业时代用电力度量能源、用"度"计价;AI时代的智能用Token度量,Token就是这个时代的"度"。
这个工厂的首期基建是一套华为昇腾384超节点算力集群——384张国产AI芯片组成一个超级计算机,是江苏省第一个同级别集群。而它要生产的"成品",就是你每次用AI助手、调用大模型时消耗的Token。
几乎同一时间,中国电信推出了面向企业和个人的Token套餐,最低9.9元/月、最高299.9元/月;上海移动宣布推出Token通用服务,跨平台使用、话费结算。
4月27日,润建股份(002929)发布2025年年报,算力业务大幅增长,子公司五象云谷同月在深圳AI算力产业大会上宣布全面转型Token工厂——从裸金属出租转向按Token计费,已成为公开战略。
不到一个月,一份年报的算力增长数据、一家子公司的Token工厂宣言、一个签约、两个运营商套餐——Token经济从研报概念变成了财报、合同和套餐。
中国日均Token调用量增长轨迹
但问题来了:Token消耗两年涨了超千倍,这背后是什么在驱动?谁来为这场算力黑洞买单?
是什么变了?答案是Agent(智能体)。
以前用AI,一问一答,消耗几百个Token。现在一个企业级AI Agent做一个市场计划,自己上网搜数据、读报告、整理表格、写PPT、群发邮件——这个流程不是一次调用,是几百次调用串联,Token消耗量是传统聊天的几百到上千倍。
不是用AI的人多了1000倍,是每个人每次用AI消耗的Token多了1000倍。
全球科技巨头资本开支(单季度)
国内这边,腾讯2026年一季度资本开支319亿元,同比增16%,环比增63%,创单季历史新高。腾讯高管在电话会上说——"今年下半年将有更多国产芯片陆续投入使用"。阿里在5月13日电话会上也给出了超预期的AI资本开支指引。
但供给端比需求端复杂得多。
英伟达H200、GB200能不能进中国,悬而未决。即便H200获准出口,国产替代的趋势也不会改变——因为推理场景中,国产芯片和H200的性能已经接近,而Token消耗的增量主要在推理端。
供给在收紧,需求在井喷。这个剪刀差怎么收窄?答案指向了一个方向:国产芯片。
华为昇腾910C,128GB显存。英伟达H200,141GB显存。推理场景中差距已经不大——因为推理的核心是显存容量和吞吐稳定性,不是单次计算速度。
但训练一个万亿参数的大模型,需要几千张芯片并行、高速互联、软件框架做复杂调度。英伟达在这块的护城河不是芯片本身——是积累了近二十年的CUDA生态,几百万人用了几百万行代码在上面写东西。
2026年4月,DeepSeek V4发布——中国大模型第一次使用国产算力参与训练。华为昇腾参与了V4-Flash的部分训练,寒武纪(688256)实现了"Day 0适配"——模型发布当天就完成芯片适配、算子优化和代码开源。这个事件的意义不在技术参数上,而在信号意义上:国产算力从"能用"进入了"敢用"阶段。
黄仁勋自己也说:"如果中国大模型率先跑在华为芯片上,对美国将是重大冲击。"
冷静看,目前国产芯片在推理端已经能打,但如果美国突然放松H200出口管制,替代紧迫性确实会下降。不过这只是短期扰动——能跑国产训练这件事本身已不可逆。
关键跟踪指标:下一个国产参与训练的大模型是谁?如果DeepSeek V5宣布100%用国产算力训练——那才是真正的引爆点。
先解释两个概念。裸金属就是直接租物理GPU——你有100张H100,租给别人按小时收钱,别人租去干什么、Token产出效率高不高,跟你没关系。赚的是租金差,跟房东一样。Token工厂不一样——同样的100张卡,你自己做推理优化、调度算法、模型适配,把算力"磨成"Token按用量卖给客户。比拼的不是"我有多少张卡",而是"同样的电力和硬件,谁产出的Token更多更便宜"。
买房出租,赚租金差。先花大钱买卡建机房,慢慢收租金。盈利取决于上架率和租金差。
发电卖电,按用量收钱。不租卡,直接把算力"磨成"Token卖给你。比拼的不是"我有多少张卡",而是"固定电力功率下,每瓦产出多少高性能Token"。
不发电,聚合调度收过路费。OpenRouter聚合60多家供应商、800多万用户,抽佣约5.5%,月Token服务量约80万亿。
看一个海外标杆——Fireworks AI。2022年成立,专注推理优化和Token生产。2026年2月年化收入3.15亿美元,毛利率约50%,最新融资估值40亿美元。核心竞争力在工程上——同样的硬件配置,Token产出更快、成本更低。
商业模式变了,估值逻辑就变了。国内押注这条路的玩家不少:润建股份(002929)在手订单230亿,年报明确转向按Token计费;弘信电子(300657)要跑"国产芯片+国产模型+按Token计费"全链条。转型不是改名——谁有工程团队、谁有模型适配经验、谁已经拿到了按Token计费的客户,这些才是甄别真假Token工厂的关键。
现在是2026年5月,三条战线同时开打:
一旦Token和话费套餐打通——"199元套餐含100GB流量+5000万Token"——上游Token工厂的需求更加刚性,但定价权可能从工厂向运营商转移。
腾讯明确"下半年将有更多国产芯片投入使用",阿里资本开支超预期。国产GPU流片产能在未来两三个季度被高度锁定,中小玩家拿不到卡。
协创数据(300857)2025年服务器采购计划212亿,2026年2月追加110亿。宏景科技(301396)计划年内新增约3000P算力。润建股份(002929)在手订单230亿。全国同期在建智算中心超20个。
牌桌上的人越来越多,筹码越来越重。谁会先出局?
能留下来的,路径清晰:有产能锁定 + 有工程团队 + 有计费客户。
Token经济不是单一赛道,是一张四层价值分配图。
| 环节 | 位置 | 核心企业 | 利润特征 | 当前状态 |
|---|---|---|---|---|
| 上游-芯片 | AI训练/推理芯片 | 寒武纪(688256)、海光信息(688041) | 毛利率50-70% | 推理端已能打,训练侧突破中 |
| 中游-制造 | AI服务器+智算中心 | 中科曙光(603019)、弘信电子(300657)、润建股份(002929) | 毛利率10-30% | AIDC集中交付,向Token计费转型 |
| 中游-运营 | Token工厂/算力云 | 弘信电子(300657)、优刻得(688158)、首都在线(300846) | 毛利率20-40% | Token工厂模式初步落地 |
| 下游-消费 | 大模型/Agent/企业AI | MiniMax、智谱、科大讯飞(002230) | 毛利率30-60% | API调用量爆发 |
寒武纪(688256)、海光信息(688041)。赚的是替代从50%到100%的钱,不是从0到50%。不管下游什么模式都得买芯片。但估值已充分反映预期,业绩兑现是最大考验。
弘信电子(300657)、润建股份(002929)。当前市场给的还是算力租赁估值,Token工厂模式验证后估值中枢会上移——对标Fireworks AI的40亿美元估值。
宏景科技(301396)、协创数据(300857)。弹性大但波动大,紧密跟踪设备到货和收入确认。"PPT订单"是行业最大隐雷。
短期缓解替代紧迫性,但DeepSeek V4已证明国产可以训,趋势不可逆。
Agent商业化不及预期,Token消耗从三位数增速回落到两位数,工厂产能利用率和定价承压。
推理和训练市场割裂,训练侧国产替代逻辑受损。
单AIDC动辄数十兆瓦,在东数西算算电协同落地前电力供给可能成为硬约束。
景气时签的框架协议,下行时集中违约。甄别真交付和假框架是第一风控动作。
| ETF名称 | 代码 | 题材相关性 | 十大重仓股(与正文标的重合部分) |
|---|---|---|---|
| 人工智能ETF万家(159248) | 159248 | 紧密跟踪人工智能主题指数 | 寒武纪(688256)、中科曙光(603019)、科大讯飞(002230) |
| 科创创业人工智能ETF景顺(159142) | 159142 | 紧密跟踪科创创业人工智能指数 | 寒武纪(688256)、协创数据(300857) |
| 基金名称 | 代码 | 近一年涨幅 | 相关重仓股 |
|---|---|---|---|
| 长盛电子信息主题混合A(000063) | 000063 | +51.00% | 算力基建相关标的 |
| 华商计算机行业量化股票发起式A(007853) | 007853 | +21.84% | 计算机行业相关标的 |