上证报中国证券网讯(记者 孙小程)近日,具身领域热门榜单WorldArena Track1(世界模型感知与动作响应赛道)最新评测结果揭晓,智元自研的世界模型Genie Envisioner-Sim 2.0(以下简称GE 2.0)获得总分第一。
“世界模型感知与动作响应”赛道聚焦具身智能最本质的“认知与行动”能力,是评判通用人形机器人(886069)智能化水平的核心标尺。
在GE 2.0技术报告中,智元团队对模型进行了全面的能力剖析。GE 2.0在功能上首次全面覆盖了长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等核心环节,构建了世界模拟器完整的技术能力闭环。
在长时序推理任务中,GE 2.0表现出极强的稳定性,画面质量随推理时长的衰减显著弱于行业基线方案。即使在连续推演40秒-50秒的长视频片段时,其生成质量依然超越了基线模型前10秒内的表现。
作为世界模拟器,核心在于能否真实反映物理世界。团队验证了大量闭环评测结果,证明GE 2.0在多项任务上均与真实世界保持着强相关性。
在奖励模型(Reward Model)的加持下,GE 2.0能够对闭环评测的rollout过程进行自动化筛选,将世界模型中产出的有效高质量数据精准回流给策略模型(Policy Model)。实验证明,这一机制在多项任务上均助力策略模型实现了显著的性能涨点。
