据中国光谷消息,全球首款人形机器人(886069)动作大模型于5月9日在湖北人形机器人(886069)创新中心正式发布。该模型能够将文字、视频等多模态信息快速转化为机器人可执行的动作指令,实现“一句话”或一段视频教会机器人干活,大幅降低了机器人动作训练的成本与门槛。
该模型由北京大学武汉人工智能(885728)研究院联合北京虚拟动点科技有限公司研发,其训练数据与真机验证由湖北人形机器人(886069)创新中心提供。模型由MotionMaster(虚拟动作生成器)与UniAct(真机执行引擎)两大核心模块构成,可将高阶语义、视频、音频等信息一键转化为多品牌、多机型通用的机器人动作指令。目前,模型已在开源社区GitHub上线并面向全行业开源。
基于该模型,潜空间具身智能(武汉)科技有限公司推出了首个应用级平台“潜擎”。用户在该平台上无需专业编程,通过输入文本或视频,1到2秒即可生成10到20秒的机器人动作,并能实现多机器人协同的舞台级编排。
活动现场,潜空间与湖北光谷东智具身智能技术有限公司、宇树科技(300674)股份有限公司等多家人形机器人(886069)整机企业签约,将以“潜擎”平台赋能更多人形机器人(886069)动作学习。同时,湖北人形机器人(886069)创新中心也与虚拟动点、潜空间等多家企业签约,将面向巡检、家庭服务、养老等垂直场景共同开发人形机器人(886069)模型,推动人形机器人(886069)加速应用于各行业。
湖北人形机器人(886069)创新中心是目前国内规模最大、场景最丰富、机器人款式最多的人形机器人(886069)创新中心之一,日产约2.4万条有效数据用于机器人训练。
原文:人形机器人动作大模型在光谷发布,“一句话”教机器人干活(来源:中国光谷)
