中国信息通信研究院总工程师何宝宏:顶级开闭源模型性能差距正在快速缩小中性

2026-05-29 22:04:42
分享
AIME

问财摘要

1、中国信息通信研究院总工程师何宝宏在数字经济大会上发表主题演讲,分享了他对AI产业发展的新观点。他指出,过去一年不论是语言模型还是多模态模型,都取得了长足进步。同时,越来越多的开源模型的性能已经逼近闭源模型的性能。 2、何宝宏认为,当下互联网上的模型预训练撞上了“数据墙”,数据已成为制约模型性能提升的核心因素。他提出了三个解决路径,一是从公域走向私域,二是合成数据,三是提升数据的质量。
免责声明 内容由AI生成
文章提及标的
人工智能--
数字经济--

5月29日,以“智变:人工智能(885728)重构增长新范式”为主题的2026证券市场年会行业分会数字经济(885976)大会在京举办,此次大会由《证券日报》社主办、中国上市公司协会指导、华为技术有限公司支持。

在主题分享环节,中国信息通信研究院总工程师何宝宏以《AI发展新观察》为题发表了他对于AI产业发展的新观点,针对基础模型的技术发展、模型训练数据、算力、Agent(智能体)、具身智能、AI产品形态等多个层面分享了他的最新观察。

从基础模型技术进展来看,何宝宏提到,过去一年不论是语言模型还是多模态模型,都取得了长足进步。

何宝宏表示,据中国信息通信研究院评测,过去一年语言大模型能力提升约35%,多模态模型能力提升50%以上;产业创新重心正从语言模型走向多模态,多模态正在加速突破各类技术瓶颈。同时,越来越多的开源模型的性能已经逼近闭源模型的性能;顶级开闭源模型间性能差距快速缩小,从内部变化来看,开源模型数量开始走向收敛,下载量、使用量及衍生模型高度集中于头部,TOP5开源模型下载量占比超过83%,而半数模型累计下载量不足200次;此外,业界开始发展世界模型,以学术界主导为主尚处于探索初级阶段;还存在技术路线不清、概念边界模糊等问题;但这一技术路线发展趋势不变。

具体到数据层面,何宝宏认为,当下互联网上的模型预训练撞上了“数据墙”,数据已成为制约模型性能提升的核心因素,换而言之,即当下模型已将互联网上的公域数据数据消耗殆尽,已无新数据源提升模型能力。

要如何解决这一问题?何宝宏认为有以下三个解决路径,一是从公域走向私域,针对特定行业私域数据的开发利用;二是合成数据,控量使用传统算法及AI的算法合成数据训练模型;三是提升数据的质量;用先进的数据工程不断提升已有数据的质量,更好服务好AI。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号-4
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈