人形机器人开始进厂“打工”，AI大模型为其赋能！

作者：陈炳欣 04-07 14:55

相关舆情 AI解读生成海报

来源：爱集微 #人形机器人# #人工智能# #大模型# #具身智能#

4.2w

（文/陈炳欣）3月16日，梅赛德斯·奔驰和人形机器人公司Apptronik宣布达成协议，梅赛德斯·奔驰将引入Apollo机器人到其工厂，测试人形机器人在车厂环境中的应用。

2月22日，在优必选公布的一段视频也显示，优必选工业版人形机器人Walker S已经在蔚来汽车工厂中进行“实训”，以测试其启停自适应行走、鲁棒里程计与行走规划等方面的能力。

2024年年初，人形机器人初创公司Figure宣布与宝马公司达成协议，正式将其人形机器人引入宝马的汽车制造工厂。

除此之外，Agility Robotics与亚马逊，以及波士顿动力等，都纷纷开启了对旗下人形机器人的实践性测试工作。这些情况表明，人们对人形机器人的开发向前迈进了一大步。

在整个开发实测过程中，人工智能都发挥了关键性的作用，有效增强了人形机器人在应对不同环境与任务中的泛化能力。这是人形机器人得以开启实测应用的关键之一。

“量产化元年”将至？

近日，工业和信息化部等7部门印发《关于推动未来产业创新发展的实施意见》，提出“做强未来高端装备，突破人形机器人、量子计算机等产品”。随着人工智能技术取得突破性进展，人形机器人发展动能愈发强劲。

中国科学院褚君浩院士在近日举办的2024中国人形机器人生态大会上表示，第四次工业革命的主题是智能化，在智能时代，人形机器人是智能化融入现实世界的重要部分。俄罗斯工程院孙立宁院士也指出，人形机器人具备万物互联、协同感知、智能决策、人机交互能力，成为未来复杂场景的真正超级终端。人形机器人的发展目标是提升运动能力、智能化水平、控制成本、拓宽应用场景，最终实现大范围的将人类从危险、繁重、重复的工作中解脱出来，造福人类。

人形机器人作为具身智能的重要载体，正在成为人工智能领域的研究热点和投资风口，甚至有观点认为，2024年将成为“人形机器人的量产化元年”。随着人形机器人功能迈向多样化和普适化，产业分工日趋成熟，成本持续下探，潜在应用场景包括制造业、家庭服务等多个领域。有数据显示，2035年全球人形机器人制造和家庭服务市场销量达到1318万台，2025-2035 年CAGR为98.2%；市场规模达到1103亿美元，2025-2035年CAGR为68.6%。

机器人可以视为AI+制造业的最佳结合体。中国是全球最大的制造业基地，市场前景发展广阔。同时，老龄化已成为工业化国家不得不面临的问题。要想解决这一问题，向资本密集型的自动化、智能化产业转型是更有可能的路径。对于中国而言，高端制造业的进一步升级也是紧迫而必要的。

大模型赋能巨头纷纷入局

近年来，人形机器人的技术开发取得快速进步。以特斯拉人形机器人Optimus为例，在不到两年的时间里就实现了快速迭代：2021年首届AI DAY 马斯克首次公布Optimus 概念图；2022年即实现原型机的首秀；2023年特斯拉自研超算 Dojo为 Optimus 提供算力支持，可加快训练速度并降低训练成本。国内方面，宇树科技、傅利叶智能、小鹏XPENG Robotics等也开发出一系列在速度、力量、机动性和灵活性等方面具备优势的人形机器人。

这些突破性进展的取得，与AI大模型在技术上的赋能有着紧密关系。以往受到算法模型局限，机器人很难实现通用化，只能针对特定领域进行训练，满足某一特定用途，这限制了机器人的应用场景。具备强大泛化能力的大模型的出现，使机器人的能力有了跃升的现实基础。正如科大讯飞开放平台研发总监刘可为指出，大模型横空出世，机器人行业迎来全新发展机遇。以具身智能为代表的人形机器人成为发展趋势。决策更聪明、功能更实用、体验更自然，应用更多样。

受大模型推动，一众科技巨头也纷纷入局，提前卡位人形机器人产业。GTC 2024上，英伟达CEO黄仁勋宣布推出名为Project GROOT Foundation的AI模型，旨在创建性能更好的人形机器人，此外还发布一款面向机器人开发的Thor系统芯片，并对NVIDIA Isaac机器人平台进行重大升级。

去年的世界声博会上，科大讯飞董事长刘庆峰宣布，以讯飞星火认知大模型为基础，讯飞机器人超脑平台做了进一步升级，展示了大模型+具身智能的人形机器人，将人工智能与机器人技术实现了结合。

同样是在去年，谷歌DeepMind 推出全球首个控制机器人视觉－语言－动作的大模型RT-2，通过将VLM预训练与机器人数据相结合，能够端到端直接输出机器人的控制。Meta和CMU团队联合推出通用机器人智能体RoboAgent。考虑到机器人在现实世界中的训练和部署效率问题，Meta 将数据集限制到了7500个操作轨迹中，并基于此让RoboAgent实现了12种不同的复杂技能，包括烘焙、拾取物品、上茶、清洁厨房等任务，并能在100种未知场景中泛化应用。

算力瓶颈将越来越明显

虽然各家科技巨头厂商都在针对通用机器人大模型进行深入探索，但距离实现真正的具身智能水平的模型还有很长的路要走，人形机器人的发展还面临着诸多问题，包括机器人数据、实时性、软硬件融合等。

表现得最突出的问题是，随着人工智能逐步深入到人形机器人的研究开发当中，算力瓶颈将越来越明显。当前各大科技厂商研究出的算法虽然能够实现机器人技能水平的提升，但是在响应速度方面仍然较差。谷歌RT-2的演示视频需要2倍速播放才能实现比较流畅的机器人动作，而斯坦福大学李飞飞团队提出了智能系统 VoxPoser更是需要8倍速才能有流畅的动作表现。实时性的提升依赖于算力，对于面对高复杂性环境的人形机器人尤其重要。

软硬件能力的协同进化也同样重要。波士顿动力创始人Marc Raibert在演讲中提到，未来的机器人技术发展过程中，硬件工程和软件同等重要。“有些人认为软件可以克服硬件上所有的问题和限制，我并不赞同这个观点。”

浙江大学教授熊蓉也在2024中国人形机器人生态大会中指出，人形机器人的大脑执行环境感知、行为控制、人机交互等功能，小脑进行复杂运动建模与控制，肢体则进行各种命令的执行，并保持灵活稳定。人形机器人的系统研制方面，存在关节多、模块多、要求多，缺乏功能－结构－机电－材料一体化设计等方面的挑战，需要解决系统研制、稳定控制、通用智能等方面的难题。