【大河财立方记者陈薇文图】6月23日,火山引擎在北京举办2026夏季FORCE原动力大会上,发布了豆包2.1Pro模型,同时,Seedance2.5也预告将于7月上线。
但是,在介绍这些新模型产品时,没有冗长的技术参数,火山引擎总裁谭待只是表示,这些模型跨过了“生产级质变点”,可以服务商用级场景。
这句话的潜台词很明显,当下模型好不好,不再只看跑分、排名,看的是能不能扎进真实业务里干活。
从“能对话”到“能商用”
过去两年,大模型行业陷入一种惯性:发布会比参数,榜单比排名。但企业真正买单时,却发现大模型确实能干活,但它干活的时候存在高随机性和低稳定性问题,在真实的开发环境中面临各种工程化的问题。
此次豆包发布的2.1Pro模型,在Terminal Bench2.1、SWE-Pro等代码评测和OSWorld等Agent评测里进入了全球第一梯队,但谭待在大会现场,却花更多的时间,以实践案例展示了模型的Coding和Agent生产能力。
在一项芯片设计RTL的测试中,豆包2.1Pro连续运行近18小时,经历9轮迭代,还跑通了仿真、测试、综合检查等完整工程流程,展现出模型在工程场景里的生产级Coding交付能力。
依托豆包2.1Pro模型搭建3D虚拟城市场景,可实现500余个智能Agent同步协作,完成上千轮工具调用,生成超百栋建筑。
AgentKit、HiAgent3.0、ArkClaw企业版Agent工作台的升级,也是顺着生产力的逻辑,它提供给企业不是一个更聪明的模型,是一套能直接编排进业务流程的系统。
多模态层面,即将在7月发布的视频生成模型Seedance2.5,支持30秒单段原生视频直出,它的应用场景不只是做短视频娱乐,而是商业广告、具身智能、工业制造、智能驾驶领域的数据合成和场景仿真等生产领域。
可以看出,“生产”“商用”这类词在被反复提及,大模型行业背后的心态在转变,AI不能再是演示用的玩具,得是能接单的“数字劳动力”。
生产端才是愿意付费主力
这不是豆包一家的策略。2026年上半年,头部厂商的发布会都在淡化参数,强化商用性。因为厂商已经用数据印证,商用场景才是大模型服务付费的大户。
截至2026年6月,豆包大模型日均词元(Token)调用量已突破180万亿,较2024年5月首次发布时的1200亿规模,两年间涨幅高达1500倍。在公有云MaaS市场,火山引擎已占据49.5%的份额。
其中,年度累计Token消耗超万亿的企业客户从去年12月的100家翻倍至200家,广泛覆盖互联网、教育、金融、消费电子(881124)、传媒及制造等众多行业。
阿里的Qwen3.7-Max则在电商、金融等领域表现出色,其AI客服“店小蜜”累计服务了3亿人次消费(883434)者,帮助商家转化效率提升了30%。
百度(BIDU)文心一言企业级用户数已突破3200万,在搜索引擎、智能客服、内容创作、企业知识库等场景实现了深度应用。
截至2025年第三季度,智谱(HK2513)GLM机构客户数已超过12000家,企业级智能体业务收入同比增长显著。
B端需求迅猛增长的背后,不仅是模型的能力提升,也有整个行业使用成本的集体下移在推动。当模型能力跨过“能用”的基准线,且价格被压到足够低时,规模化落地便成了自然结果。
此次,火山引擎将豆包2.1Pro的综合成本,较海外顶尖模型Claude Opus4.6降低近80%。
6月15日,MiniMax则将M3模型以5%—10%的价格,提供此前相近的模型能力。6月1日,DeepSeek V4Pro的API定价永久性调整为原价的四分之一。
对企业来说,大模型行业的这些变化,都契合了他们更加看重投入产出比、工程化落地能力等需求,让他们愿意将大模型主动融入千行百业的生产链路中。
