大模型加速人形机器人落地 软件算法硬件化是关键

来源: 2024-05-22 23:20:18

  记者骆轶琪 东莞报道

  “机器人”概念在智能化浪潮下已经发展多年,但似乎是在大模型技术迭代之下,开始迎来更好的发展机会。

  近日举行的第十四届松山湖中国IC创新高峰论坛上,神顶科技(南京)有限公司董事长、CEO袁帝文回顾历史分析道,早在20年前,面对日本开始做人形机器人的形态,资本市场普遍观念是不靠谱。但近期市场开始重视这类形态,很大程度是与大模型的快速发展有关。

  “大模型能够把过去20年间所有的信息、论文等数字化后,进行训练。目前的结果是,机器人可以作诗、拍电影,把人雅致的一面学习过去了,但真正具体干活儿,例如倒垃圾能力还不够。所以我们看到大模型公司都在积极与人形机器人公司合作,做数据采集等工作,类似特斯拉推FSD(完全自动驾驶)前期也需要做类似采集,这是自动驾驶的基础。”他认为,如果人形机器人最终的目的是要跟人一样可以煮饭、搬重物,就需要有人的角度和视野,结合物理世界的场景做训练。这其中就需要大模型能力的加持。

  这几乎成为一种共识,一名芯片行业从业者对记者举例分析道,扫地机器人在发展早期,往往难以辨别“这是一摊水”“这是一层台阶”等问题,令早期其应用备受争议,但大模型的出现,将加速各类型服务机器人的识别和执行效果。当然对从业者来说,将软件算法硬件化,可能正成为其中一个重要能力,而大模型本身的迭代进化,也为当前推进落地带来一定挑战。

  智能化累积

  根据2022年国家机器人检测与评定中心等单位联合发布的《机器人智能等级划分标准》,以解放人体、自主完成任务为目标,综合考量机器人的感知、认知、决策和执行能力,将机器人的智能程度划分为L1(基础型)、L2(半交互型)、L3(交互型)、L4(自主型)、L5(自适应型)多个等级。

  东方证券分析认为,现阶段看,由大模型作为核心“大脑”的Figure 01、Tesla Optimus等通用人形机器人基本已经能实现较为自然的人机交互,无需任何控制装置,仅用自然语言发出指令即可实现指令下达,整体基本达到L3级水平,但距离真正类人的交互还有一段距离。

  大模型在其中或许将起到加速作用。珠海一微半导体机器人事业部总经理杨武表示,机器人市场前景广阔,这是来自于人赖以需要各类型服务,尤其是老龄人群需要机器人帮助提供服务。但其技术密集度高,是电路、水路、气路等多个维度的技术融合。

  “好消息是,中国在这方面技术不落后甚至是先进的。日本当初做出跳舞机器人时候大众很震惊,但到了今天,无人机等各类型机器人已经可以集成化发展,所以中国在这方面是领先的,那么对后续的产业发展和全球带动作用都将比较明显。”根据他分析,按照以往技术迭代经验,终端类产品一年有10%~20%增速就是稳步发展,但当前,技术进步将令人形机器人迭代呈现指数级别发展。

  前述从业者也对记者分析道,预计未来,随着智能化和互联等能力提升,智能生活将呈现家庭中控作为中心,多类型终端围绕不同家庭人群和场景运作的生态。例如家中有专门机器人辅助老人生活、陪伴孩子学习等。

  “当然这中间还面临几个难题。”该名人士续称,首先是机器人的智能化程度提高,有赖于当前大模型能力辅助,“机器人在有大模型能力后,就更容易理解现实世界中‘看’到的到底是什么,然后做出相应反馈,这将前进一大步。”

  另外则是能源和伦理问题仍有待解决。例如具备高算力的机器人,将可能有很高能耗,如何避免“充电需要几小时,但只能用几十分钟”的难题,需要持续解决;此外是机器人毕竟是复杂设备,深入人类生活涉及诸多隐私和个人问题,如何前置管理也是核心命题。

  “当然这只是眼前,再过五年,或许就有很大改善了。”该人士如此表示。

  东方证券认为,AI大模型的出现为人形通用机器人的发展带来了新的曙光,具身智能也是AI发展的终极目标。人形机器人是软硬件能力高集成的实体,商业化的核心突破点在于“AI大脑”。大模型具备强大的泛化能力,让通用这一目标的实现成为了可能。

  此外,政策边界已逐步形成。2024年3月,欧盟通过了全球首个关于人工智能的综合法律框架《人工智能法案》,旨在确保人工智能系统尊重基本权利、安全和道德原则,并解决非常强大和有影响力的人工智能模型的风险,在欧洲及其他地区培育值得信赖的人工智能。

  算法渗透

  前述论坛上,多数业内人士认为,大模型驱动的机器人将在3年内面世。一部分人则认为可能将在未来3~5年内。

  从应用场景看,三年内被认为能快速量产落地的服务机器人类型,包括娱乐机器人(用于游戏互动等)、儿童教育和陪伴机器人、老人看护陪伴机器人等。

  (业内关于三年内量产的服务型机器人类型研判,图源:主办方提供)

  当然考虑到持续性应用和迭代优化角度,如何让服务型机器人更好使用大模型,是当前必须思考的问题。

  瑞芯微电子高级副总裁陈锋指出,随着大模型技术的迭代演进,参数规模在持续上涨。但应用到机器人本身,未必需要很多参数。因为大模型参数就意味着很高的算力要求,如果是针对特定应用场景,采用CNN算法某种程度上或许会比大模型更为高效。

  成都启英泰伦科技有限公司创始人、CEO何云鹏也认为,看大模型对机器人行业带来的影响,首先要看如何定义:如果是做一款通用型机器人,那么就需要有极为丰富的世界知识,这是当前市面上机器人还没有做到的;但如果是面向特定场景,就无需极大量模型参数,甚至少则0.1B规模都有可能实现。

  他分析道,AI大模型最新带来的突破,更多是模型参数累积后带来的震撼,这证明了生成式AI和Transformer架构的注意力机制能在实际场景中带来价值。

  “实际上现在还不能说当前的模型结构就已经发展到头了。”何云鹏续称,未来可能模型发展还有新的可能。所以在相应发展机器人时,就需要将机器人的实际应用,结合大模型的特点,采用相应的AI算法,这才能真正推动机器人更好商用。

  对于芯片厂商来说,将核心算法软件化,或许正成为其中一个切入点。

  前述从业者对记者表示,目前如果要让大模型上车,其规模可达100T~1000T数量级,那么就对功耗、网络、成本提出极高要求。“我们希望把高算力的东西做成链接单元。不需要大量CPU运算,直接通过指令快速实现翻转和执行,类似GPU的运作模式,由此形成硬件的联动机制。据我观察,将核心算法软件化也是业内都在探讨的方向。”

  至于其中门槛,他指出,一方面来自芯片设计水平,考虑到高端工艺芯片设计成本很高,那么如何通过更少的迭代来适应算法发展;另一方面需要很强的算法能力,才能满足芯片设计需求。

  东方证券认为,软件决定人形机器人“高度”,算法需与硬件匹配。人形机器人本质是AI系统落地物理世界的最佳载体,更核心问题在于算法对运动能力的控制,包括本体平衡、行走的步态、手部抓取等规划与控制。这需要成熟的感知系统基础、强大的算法分解任务和规划动作、大模型不断仿真训练以及超强的算力支撑,同时要求算法与硬件相匹配。这要求机器人企业需自研算法,并持续更新迭代。

相关板块
相关个股
相关资讯
免责声明:本文转载上述内容出于传递更多信息之目的,不代表同花顺财经的观点。文章内容仅供参考,不构成投资建议。同花顺力求但不保证数据的完全准确,如有错漏请以证监会指定上市公司信息披露平台为准,各类信息服务基于人工智能算法,投资者据此操作,风险自担。