世界模型是自去年以来人工智能(885728)领域的热词,不仅备受追捧,且存在多种技术路线。作为世界模型的领军人物之一,AI科学家李飞飞6月4日与其创办的World Labs团队在美国内容发布与订阅平台substack上发表题为《世界模型的功能分类:渲染器、模拟器、规划器,以及连接它们的循环》的长文,试图厘清2025年以来“世界模型”这个概念在使用上的混乱。李飞飞表示,大语言模型让机器学会了遣词造句和逻辑推理,但物理世界运行的底层逻辑完全不同。语言模型学的是文本的统计规律,而世界模型学的是时空的统计规律,比如光怎么照在物体上、东西受力后怎么运动。正因为涉及物理世界,计算机视觉、机器人、强化学习、生成式AI等领域都在用“世界模型”这个词。一个能生成火焰视频的模型、一个能凭空生成可玩游戏(881275)的语言模型、一个能精确模拟燃烧过程的物理引擎,现在都被叫作世界模型,但它们实际在做三件完全不同的事:渲染、模拟和规划。其中,模拟器得到的公众关注最少,却可能是让AI真正理解物理世界的基础。(澎湃新闻)
