国金证券(600109)发布研报称,计算机行业AI交互正从单次问答转向自主长时运行Agent,OpenClaw等开源项目爆火印证此趋势。Agent任务Token消耗达传统对话4至15倍, 长Agent驱动算力需求非线性提升, 杰文斯悖论进一步放大效应,推动内存带宽与算力密度持续扩张。
国金证券(600109)主要观点如下:
计算需求范式跃迁:从Prompt到长Agent
1)人工智能(885728)的交互范式正在经历根本性转变,AI系统已从单次问答工具演进为能够推理、规划、持续运行的自主Agent,趋势已获明确印证:OpenRouter平台数据显示多步骤推理和链式工具调用正在快速取代传统单轮交互。开源Agent框架OpenClaw发布仅四个多月便以超过24.8万GitHub星标登顶全球开源项目榜首,标志着长运行Agent从实验阶段全面进入生产部署。2)Agent任务对Token的消耗已远超传统问答场景:Anthropic实测数据显示,单Agent消耗约为对话模式的4倍,多Agent系统则高达15倍。NVIDIA在其2026年1月技术博客中亦明确指出,下一代AI工厂必须具备处理数十万输入Token的能力,以支撑Agentic推理所需的长上下文。范式跃迁已经发生,算力需求的新增长逻辑形成。
长Agent驱动算力需求非线性提升
长Agent对算力需求的拉动有几个核心原因:1)技术机制:首先大模型自注意力机制的计算成本与上下文长度呈二次方增长,其次推理Decode阶段天然受制于内存带宽,随着KVCache随上下文线性膨胀,GPU利用率持续下降,吞吐瓶颈日益突出,主流厂商的定价结构就是物理成本的体现:谷歌(GOOG)Gemini 3.1 Pro和阿里(BABA)云Qwen均采用按上下文长度分档的阶梯定价。2)多Agent协作架构的兴起引入了额外的通信开销维度。Gartner数据显示,2024年Q1至2025年Q2企业对多Agent系统的询盘量暴增1445%;而GOOGle DeepMind研究指出,并行Agent之间的全局上下文压缩传递会产生不可避免的"协调税",通信成本随Agent数量非线性扩大。3)杰文斯悖论进一步放大了上述效应,微软(MSFT)CEO纳德拉预判,模型推理效率的提升带来成本下降反而刺激使用量以更快速度增长。综合分析,该行认为Agent运行时长的增加是技术趋势的必然,在可见的未来,对内存带宽、互联吞吐与智能计算密度的需求,将持续以非线性速率扩张。
投资建议相关标的:
海外算力/存储:中际旭创(300308)、东山精密(002384)、胜宏科技(300476)、天孚通信(300394)、新易盛(300502)、工业富联(601138)、兆易创新(HK3986)、大普微、源杰科技(688498)、景旺电子(603228)、英维克(002837)等;Lumentum、闪迪(SNDK)、铠侠、美光、SK海力士、中微公司(688012)、北方华创(002371)、拓荆科技(688072)、长川科技(300604)。
国内算力:寒武纪(688256)、东阳光(600673)、海光信息(688041)、协创数据(300857)、豫能控股(001896)、华丰科技(688629)、亿田智能(300911)、星环科技(688031)、网宿科技(300017)、首都在线(300846)、神州数码(000034)、百度(K89888)集团、大位科技(600589)、润建股份(002929)、中芯国际(688981)、华虹半导体(HK1347)、中科曙光(603019)、润泽科技(300442)、浪潮信息(000977)、东山精密(002384)、奥飞数据(300738)、云赛智联(600602)、瑞晟智能(688215)、科华数据(002335)、潍柴重机(000880)、金山云(HK3896)、欧陆通(300870)、杰创智能(301248)。
CPU:海光信息(688041)、中科曙光(603019)、澜起科技(688008)、禾盛新材(002290)、中国长城(000066)、龙芯中科、兴森科技(002436)、深南电路(002916)、宏和科技(603256)、广合科技(001389)。
ai应用(886108):1)超级入口:腾讯控股(HK0700)、Minimax、智谱(HK2513)、阿里巴巴(BABA)、科大讯飞(002230)。2)星环科技(688031)、德才股份(605287)、美年健康(002044)、中控技术(688777)、卓易信息(688258)、昆仑万维(300418)等AIINFRA&高增长&高壁垒。其他:空天时代、具身智能等。
风险提示
行业竞争加剧的风险;技术迭代不及预期的风险;特定行业下游资本开支周期(883436)性波动的风险。
