中国信息通信研究院总工程师何宝宏：顶级开闭源模型性能差距正在快速缩小

5月29日，以“智变：人工智能（885728）重构增长新范式”为主题的2026证券市场年会行业分会数字经济（885976）大会在京举办，此次大会由《证券日报》社主办、中国上市公司协会指导、华为技术有限公司支持。

在主题分享环节，中国信息通信研究院总工程师何宝宏以《AI发展新观察》为题发表了他对于AI产业发展的新观点，针对基础模型的技术发展、模型训练数据、算力、Agent（智能体）、具身智能、AI产品形态等多个层面分享了他的最新观察。

从基础模型技术进展来看，何宝宏提到，过去一年不论是语言模型还是多模态模型，都取得了长足进步。

何宝宏表示，据中国信息通信研究院评测，过去一年语言大模型能力提升约35%，多模态模型能力提升50%以上；产业创新重心正从语言模型走向多模态，多模态正在加速突破各类技术瓶颈。同时，越来越多的开源模型的性能已经逼近闭源模型的性能；顶级开闭源模型间性能差距快速缩小，从内部变化来看，开源模型数量开始走向收敛，下载量、使用量及衍生模型高度集中于头部，TOP5开源模型下载量占比超过83%，而半数模型累计下载量不足200次；此外，业界开始发展世界模型，以学术界主导为主尚处于探索初级阶段；还存在技术路线不清、概念边界模糊等问题；但这一技术路线发展趋势不变。

具体到数据层面，何宝宏认为，当下互联网上的模型预训练撞上了“数据墙”，数据已成为制约模型性能提升的核心因素，换而言之，即当下模型已将互联网上的公域数据数据消耗殆尽，已无新数据源提升模型能力。

要如何解决这一问题？何宝宏认为有以下三个解决路径，一是从公域走向私域，针对特定行业私域数据的开发利用；二是合成数据，控量使用传统算法及AI的算法合成数据训练模型；三是提升数据的质量；用先进的数据工程不断提升已有数据的质量，更好服务好AI。

中国信息通信研究院总工程师何宝宏：顶级开闭源模型性能差距正在快速缩小中性