
生成式人工智能或称生成式AI、AIGC的发展促进了相关领域,特别是具身智能行业的发展,使《我,机器人》《机器人总动员》等科幻作品中的人与机器人共处的场景离现实越来越近。于是,科技巨头重金押注,创业公司争相入场。在这场关乎科技未来的竞争中,玩家们竭力挖掘护城河,试图率先创造人形机器人的“ChatGPT时刻”。
01求解动作难题如今人形机器人的迭代可谓日新月异。
机器人表演就颇为显眼。在2025年1月的央视春晚上,宇树科技机器人H1表演的《秧Bot》仅是根据节奏扭动身体和转动手帕,动作相对简单。到了2025年10月,在舞剧《天工开物》的谢幕环节中,宇树科技机器人已能精准复现舞者姿态,以流畅的侧翻、后空翻等完成“人机共舞”。
宇树科技机器人相关表演视频在抖音、快手等平台迅速传播,目前视频点赞量已累计超过130万。有用户在评论区发出感慨说,机器人动作年初看起来还不协调,没几个月已经协调到这种地步,像是“输入武功秘籍”了。

机器人的突破性进展是科技发展数十年持续积累的结果。
要知道,AI奠基者艾伦·图灵在1950年的论文中就提出过智能必须依托物理实体与外界动态交互才能形成。只是受限于科技水平,半个多世纪以来,机器人都与真正意义上的具身智能相去甚远。
在2011年福岛核电站事故中,救援现场找不到具备实际作业能力的成熟机器人,有限的设备在复杂辐射环境中频频受困,甚至被散落电缆绊倒,难以执行关键任务。在此之后,DARPA,即美国国防部高级研究计划局宣布举办机器人挑战赛,旨在推动灾难救援机器人技术研发。
第一届美国国防部高级研究计划局机器人挑战赛2012年10月启动,直到2015年6月才决出胜者。决赛需要机器人进行抵达任务区、自主下车、打开房门、关闭闸门、借助工具开洞等操作,参赛机器人大多步履蹒跚,频频跌倒,多数都无法完整完成所有操作。获得冠军的是韩国KAIST研发的机器人HuBo,行进时并不是依靠双足,而是以万向轮保证机器人的速度和平衡。亚军则是由波士顿动力研发的机器人Atlas。
彼时该决赛视频引发了公众热议——机器人行动迟缓,错漏百出,与公众期待的灵敏、智能的助手形象毫不相干。
作为全球头部人形机器人公司,成立于1992年的波士顿动力曾是行业先驱。早在2017年,波士顿动力的Atlas就展示过后空翻。然而,Atlas原先采用的是液压驱动系统,高强度、高精度的同时还有高能耗、高噪音和高成本的问题,难以商业化。波士顿动力2013年被谷歌收购、2017年转至软银,2021年又被韩国现代收购。软银时期,波士顿动力曾以约7.5万美元(约合人民币53万元)的价格将机器狗Spot推向市场,仅售出约400台。

在人工智能技术尚未成熟阶段,机器人完全依赖工程师编写的精确轨迹代码执行任务,本质与传统的生产设备并无差异。正如波士顿动力Atlas在2017年展示的后空翻动作,本质上仍是预设程序的精确执行。
之后,机器人学习进入数据驱动阶段,通过观察模仿与反复试错自主学习技能。更进一步以后,智能系统与自主学习深度融合,机器人开始能理解抽象指令,在陌生环境中主动尝试解决方案,逐步向能应对复杂现实的自主智能体进化。由此,全球玩家在算法上各展所长。
海外头部玩家Figure AI在2025年2月宣布终止与OpenAI的合作后,转向自研端到端AI模型,据称其AI大模型Helix已取得重大技术突破。Helix首次将双系统思维引入VLA模型(视觉语言动作模型),系统1专注于实时动作控制,能够以极高响应速度处理视觉信息;系统2拥有强大场景理解和语言解析能力,负责解读复杂指令、识别环境要素,并制定行动规划。双系统架构还在模块化迭代能力方面颇具优势。二者可独立优化,无需重新调整整体模型。

而1X公司Neo机器人的相关视频展示了所谓家用机器人的现有水平。Neo完成从3米外冰箱取水的基本操作耗时超过1分钟,人类完成同样任务仅需十几秒。用户无法通过“请帮我收拾房间”这样的自然指令让机器人理解并执行这套复合任务。1X公司坦诚展示了远程操作员的存在,说明当前机器人尚未突破自主应对开放环境的核心技术瓶颈。
机器人训练数据的获取与使用也是亟待解决的重点问题。
如果采用虚拟仿真环境生成训练数据,机器人就必须面对Sim-to-Real Gap(仿真与现实差距)的问题。虚拟世界中的物理参数、传感器噪声与环境交互难以完全还原真实场景的复杂性,导致在仿真中表现优异的算法迁移至实体机器人时出现明显性能衰减。
如果完全依赖在真实环境中采集数据,则面临高昂的时间成本与硬件损耗,规模化推进存在现实阻力。比如特斯拉,就选择整合自有的Dojo训练中心,让Optimus人形机器人团队放弃传统的动作捕捉技术,转而采用纯视频学习方法,通过让机器人观察人类执行任务的视频录像,自主提炼行为模式并生成操作策略。

尽管机器人技术仍面临诸多挑战,但具身智能作为科技前沿的核心方向,发展浪潮已不可阻挡。在这一新兴赛道,国内企业积极布局并已取得显著进展,展现出快速跟进的态势。
政策层面同样已释放出明确支持信号。2025年3月,国务院发布的政府工作报告中明确提出,国家将以培育壮大新兴产业、未来产业作为重点工作方向。报告首次将具身智能与生物制造、量子科技、6G等并列纳入未来产业培育范畴,具身智能发展由此上升至国家战略层面。北京、杭州等地也都围绕具身智能及机器人产业发布了针对性政策文件,旨在加速技术突破和产业集聚。
就目前来看,机器人演进与智能手机产业的发展路径极为相似。早期各家厂商各自为战,技术处于路线分化的探索阶段,逐步走向关键突破点。正如智能手机的“iPhone时刻”重新定义了移动终端的形态与生态,机器人领域也将在未来迎来属于自己的临界点——当某项技术或产品以超越用户预期的体验出现时,将迅速推动行业标准的统一与生态的成型。
这一突破将不仅仅是技术参数的提升,更是用户体验的根本性变革。在AI领域,这更像横空出世的ChatGPT,将AI从实验室概念转化为生活的日常。量产只是漫长征程的第一步,技术的加速度已露端倪,科幻作品中的智能机器人走进寻常百姓家的那一天,离我们或已不远。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237