同花顺 Logo
AIME助手
问财助手
走进“人形机器人学校”:规模化“上课”为具身智能加注“数据燃料”
2026-04-08 00:14:54
来源:证券日报
分享
AIME

问财摘要

1、本文介绍了北京人形机器人创新中心的机器人数据训练基地,该基地采集海量训练数据,为具身智能产业发展加注“燃料”。目前,基地已组建起全国构型最丰富的机器人矩阵,拥有超过120台主流机器人设备,还配备了头环式、夹爪式采集设备,动捕服、动捕手套及遥操驾驶舱等专业装备,具备真机遥操作、开放环境采集、动作捕捉采集三大核心采集能力。 2、文章还提到,人形机器人数据采集训练场、基地正在全国多地涌现。资本竞逐“数据燃料”,产业需求的指数级增长,也正在资本市场催生新的投资逻辑。随着人形机器人在多种场景应用落地,“数据飞轮效应”加速启动,更多场景带来更多数据,更多数据吸引更多开发者与算法模型,进而推动数据需求的指数级增长。
免责声明 内容由AI生成
文章提及标的
人形机器人--
传感器--
人工智能--
特斯拉--
亚马逊--
微软--

“欢迎来到北京人形机器人(886069)创新中心(以下简称‘北京人形’)机器人数据训练基地,这里是我们每天‘上学’的地方。”一台人形机器人(886069)一“开口”,就让人瞬间置身于科幻世界。

在这座坐落于北京亦庄、占地近5000平方米的训练基地里,不同构型人形机器人(886069)正同时“上课”——学习内容并非“语数外”,而是给婴儿换尿布、为老人洗头穿衣、在厨房里清洗餐盘。操作员手把手地教导,机器人一遍遍地练习,一套动作要重复数百次,才能沉淀为一条有效的训练数据。

近日,《证券日报》记者走进这所“人形机器人(886069)学校”,探寻数据采集训练场如何为具身智能产业发展加注“燃料”。

采集海量训练数据

走进机器人数据训练基地的一个仿真训练试验场,记者看到,家居、商超、办公、工业、医药、康养等30多个典型场景被一一复刻。在“儿童房”,操作员正用机械臂给婴儿模型换尿布,动作虽慢,但精准无误;在“养老院”,机械臂正在为老人模型洗头、穿衣服;厨房里,机械臂小心翼翼地清洗着餐盘;商超货架前,人形机器人(886069)一遍又一遍地练习分拣理货。

“操作机器时,动作要自然、流畅。”现场工作人员向《证券日报》记者解释。记者随即体验操作一台机械臂,基地数据采集组组长郭明轩在一旁指导:“它的机械爪动作幅度很小,并且会延迟几秒夹紧,你得稍微使点劲。”一套动作虽然简单,但要经过几十次、上百次的采集,才能成为有效的“数据燃料”。

这些场景并非静态的“样板间”,而是可动态配置、组合重构的“数据工厂”。北京人形具身数据负责人孔超向《证券日报》记者表示,目前基地拥有超过120台设备,正全力为内部算法团队及外部合作伙伴(包括机器人企业和大模型公司等)“投喂”海量的训练数据。

在采集数据过程中,最忙碌的是采集操作员。数据采集涉及动作捕捉、多模态同步、人工标注等环节,任何环节出现偏差都可能干扰模型。

据了解,机器人数据采集 是指通过人类操作或自动化手段,收集机器人在物理环境中执行任务时产生的多模态行为数据,用于训练机器人AI模型,使其具备自主感知、决策和控制能力。在人形机器人(886069)产业中,数据采集既是决定机器人能否从实验室走向千行百业的底层基石,也是驱动技术迭代、商业化落地的重要引擎。

数据训练基地负责人蒋未来告诉记者:“三个月前,这里的数据合格率仅为50%。那时候我们面临各种各样的挑战,比如机器人手臂不小心碰到了不该碰的道具等。”如今,经过无数次人员培训、流程建立、问题追溯与质量标准优化,整体数据合格率已稳定在95%以上。

从“教机器人干活”到“让机器人自己学会干活”,数据训练基地正在为具身智能的规模化落地,铺下最底层也最为关键的一块基石。蒋未来表示,随着具身智能机器人在更多真实开放场景中实践应用,该基地正迈向全球首个“百万小时数据”里程碑,助力人形机器人(886069)技术迭代和规模商用。

迈向全流程标准化

人形机器人(886069)要真正走进千行百业,需要的不是几百、几千条“精修”数据,而是海量、多样、高质量的数据“原料”。然而,数据采集之路绝非一帆风顺。

蒋未来坦言,目前数据采集面临三大核心难题:一是场景碎片化,真实环境千差万别,每个变量都在考验算法的泛化能力;二是人形机器人(886069)“方言”不通,不同构型机器人的传感器(885946)布局、关节自由度、控制接口各不相同,导致数据难以跨机型复用;三是数据质量参差不齐,采集、标注、质检任一环节出现偏差都可能产出“低质数据”,误导模型。

“数据饥饿”带来的“泛化性不足”,仍是阻碍人形机器人(886069)进入千行百业的“最后一公里”。“如果大家把具身智能机器人当做一辆汽车来看的话,数据就是汽车所需的燃料——汽油和电。它有助于机器人更好地实现运动控制自动化,具备更强的能力。”蒋未来补充说。

通过打造数据采集基地,各地可以将分散的场景集中复现,对多样的机器人进行统一调度,使采集、标注、质检全流程标准化。例如,作为具身智能“国家队”,北京人形已牵头制定国内首个具身智能数据集行业标准《人工智能(885728)具身智能数据采集规范》,通过标准定义采集规范,引领行业发展。

目前,基地已组建起全国构型最丰富的机器人矩阵,拥有超过120台主流机器人设备,涵盖双足人形、轮式、机械臂、复合型等多种形态,还配备了头环式、夹爪式采集设备,动捕服、动捕手套及遥操驾驶舱等专业装备,具备真机遥操作、开放环境采集、动作捕捉采集三大核心采集能力。

孔超表示,标准化的“数据工厂”流程,能让不同构型的机器人并行采集,实现高质量数据的规模化生产。截至目前,基地已为多家头部企业及科研机构交付超数万小时的高质量数据,服务客户覆盖物流、商超、办公、家居等多个领域。

资本竞逐“数据燃料”

当前,高质量数据已成为驱动人形机器人(886069)产业发展的战略资源。一场关于“数据燃料”的资本暗战正在全球范围内激烈上演。

人形机器人(886069)数据采集训练场、基地正在全国多地涌现。在上海张江,国家地方共建人形机器人(886069)创新中心搭建的异构人形机器人(886069)训练场里,来自10余家企业的超100台人形和类人形机器人(886069)正日夜进行操练。湖北人形机器人(886069)创新中心的数据采集场、青岛市具身智能机器人公共训练场也已落地。

此外,宇树、智元、星动纪元等品牌企业也已建设了内部或半公开的私有数据采集场,以持续夯实核心数据护城河。

“数据采集成本主要由三部分构成:资产折旧、人员成本、损耗率。”蒋未来透露,目前真机采集每小时的成本不低,且需要大量人力投入。但正是这种“重投入”,构筑了行业的核心壁垒。他进一步介绍,目前基地70%以上的产能用于服务行业客户,主要用于VLA模型训练和具身大脑研发,客户的数据需求已从去年的“几千小时”跃升至如今的“十万甚至几十万小时”量级。

中国机器人CR教育培训标准委员会委员魏国红对《证券日报》记者表示,数据训练场/基地在各地加速兴起,将助力人形机器人(886069)行业突破“小散重复”“后劲不足”等瓶颈,为各地打造全球标志性的人形机器人(886069)生态集群提供有力支撑。

产业需求的指数级增长,也正在资本市场催生新的投资逻辑。从硅谷到中关村,从PE/VC到产业资本,纷纷将目光投向“数据基础设施”这一赛道。随着人形机器人(886069)在多种场景应用落地,“数据飞轮效应”加速启动,更多场景带来更多数据,更多数据吸引更多开发者与算法模型,进而推动数据需求的指数级增长。

放眼全球,这场围绕“数据燃料”的竞赛已然白热化。特斯拉(TSLA)微软(MSFT)亚马逊(AMZN)、Robotis等国际企业均在大力投入机器人数据采集基础设施建设。而中国企业在这场竞争中展现出独特优势。“我们在人力成本、场景多样性及产业配合度上都具备国际竞争力。”蒋未来表示,一旦“无本体”数据采集(具身智能领域中一种新兴的数据采集模式,通过轻量化、便携式设备直接记录操作行为)等新技术路线跑通,就能极大丰富数据规模,推动统一数据交易市场的形成。

资本的涌入也在加速技术迭代。“从去年至今,大家有目共睹,机器人的全身运控水平提升了。”蒋未来话锋一转,“但要真正进厂打工、到田间劳作,今年需要解决几个问题:完全自主的导航、双手的精细操作、环境认知智商。”

这是一个逐层突破的过程,每一层的突破都需要时间,但一旦实现突破,技术扩散的速度会很快。他认为,未来3年至5年内,行业或许会发生质变。未来,谁掌握了高质量数据,谁就掌握了具身智能时代的“燃料定价权”。

随着更多“数据工厂”投入运营,中国人形机器人(886069)产业正迎来从“机械执行”到“自主思考”的关键跨越。数据基地的扩容并非一件特别难的事,难的是持续产出高质量数据、构建标准化体系以及打通数据孤岛。国内产业链对“数据油田”的抢占,是在具身智能时代构筑全球竞争力的关键落子。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571涉企侵权举报

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈