> 自媒体 > (AI)人工智能 > 机器人的ChatGPT时刻,谷歌DeepMind发布设备端机器人模型
机器人的ChatGPT时刻,谷歌DeepMind发布设备端机器人模型
来源:人工智能学家
2025-09-24 09:14:13
151
管理

谷歌DeepMind近日发布了一项可能重塑机器人行业格局的关键技术——Gemini Robotics On-Device。这是一个先进的视觉-语言-行动(VLA)基础模型,其核心突破在于能够完全在机器人硬件上本地运行。此举直接解决了长期以来困扰实用机器人部署的延迟和网络连接两大瓶颈,被业界视为推动“具身智能”从实验室走向现实世界的关键一步,甚至可能催生期待已久的“机器人的ChatGPT时刻”。

从云端到终端:机器人智能的范式转移

长期以来,尽管AI在云端的能力日新月异,但物理世界中的机器人发展却步履维艰。其根本症结在于,大多数先进的机器人大脑依赖于云端服务器的强大算力。这种模式下,机器人通过传感器感知环境,将数据上传至云端进行分析决策,再接收指令执行动作。然而,这一过程中的网络延迟是致命的。对于一个正在执行精细操作的机器人而言,哪怕是几百毫秒的延迟,都可能导致任务失败甚至造成物理损坏。此外,对稳定网络连接的依赖,也极大地限制了机器人在工厂、仓库、家庭或户外等网络信号不佳或不存在的环境中的应用。

Gemini Robotics On-Device的问世,正是为了打破这一范式。通过将强大的基础模型直接部署在机器人本地硬件上,它实现了低延迟的实时推理。这意味着机器人可以即时响应环境变化,独立完成复杂任务,而无需依赖任何外部网络。这不仅是技术架构的一次重大演进,更是机器人迈向真正自主性的关键前提。正如Google DeepMind所强调的,这一解决方案将帮助机器人社区应对至关重要的延迟与连接挑战,从而在根本上提升机器人的实用性和可靠性。

“视觉-语言-行动”的融合与微调之力

Gemini Robotics On-Device隶属于谷歌今年早些时候发布的Gemini Robotics模型家族,该家族基于强大的Gemini 2.0多模态大语言模型构建,并创新性地加入了“物理行动”作为输出模态。它不仅仅能理解文本和图像,更能将这种理解转化为一系列可执行的物理指令。

而此次发布的On-Device版本,最大的亮点在于其是该系列中首个支持“微调”(fine-tuning)的模型。通用基础模型固然强大,但现实世界的任务往往需要高度的专业化。DeepMind展示了该模型惊人的适应能力:开发者仅需提供少至50个任务演示,就能让机器人掌握一项全新的复杂技能。

在一系列涵盖食物准备、打牌等七项不同任务的测试中,经过微调的Gemini Robotics On-Device模型表现卓越。其平均任务成功率接近80%,显著超过了当前最先进的同类设备上视觉-语言-行动模型(成功率约为60%)。这一数据有力地证明,该模型不仅解决了本地化运行的难题,更提供了一条高效、低成本的路径,让机器人能够快速适应并精通特定的应用场景。这种强大的微调能力,极大地降低了开发和部署专用机器人的门槛。

通往“机器人的ChatGPT时刻”?

Gemini Robotics On-Device的发布在开发者社区引发了热烈反响。在Hacker News等技术论坛上,许多人认为这可能就是业界翘首以盼的“机器人的ChatGPT时刻”。一位开发者精辟地指出,其潜力在于,像Gemini这样的多模态大模型已经内建了对世界海量的常识性理解。它已经知道什么是“草坪”、什么是“玩具”、什么是“修剪”。

因此,微调的过程不再是“从零开始”教机器人认识世界,而更像是在其已有的庞大知识库之上,教它如何将这些抽象概念与特定硬件(如一台割草机)的具体操作指令序列关联起来。这解释了为何仅需少量演示就能取得显著效果。这种“知识迁移”的模式,是从抽象理解到物理行动的桥梁,也是通用人工智能(AGI)在物理世界具身化的核心体现。

为了支撑这一生态的健康发展,DeepMind还配套发布了Gemini Robotics SDK(软件开发工具包),并建立了包括用于评估机器人安全机制的ASIMOV基准和用于衡量视觉推理能力的ERQA评估数据集在内的完整工具链。这表明谷歌的雄心并非发布单个模型,而是构建一个完善、开放的机器人基础平台,赋能整个开发者社区。

尽管Gemini Robotics On-Device目前尚未全面开放,开发者需要通过注册等待名单来获取访问权限,但它的出现已经为具身智能的未来描绘了一幅清晰的蓝图。通过将智能从云端解放到终端,并赋予其快速适应新任务的能力,这项技术有望催生出新一代更自主、更灵巧、更实用的机器人,真正将人工智能的力量带入我们的物理生活。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
三菱退出中国?官方回应:将与现有伙伴继续合作
6月23日,有媒体报道称,三菱汽车将逐步取消包括欧洲、中国在内的市场业..
2026款三菱帕杰罗曝光,第二代超选四驱+2.4T/2.0T双动力..
硬派越野圈的“老将”居然换小排量了?2026款三菱帕杰罗刚露出消息,就把..
恩智浦计划退出5G功率放大器业务;三星或将退出SATA SSD市场;三菱化学出售..
五分钟了解产业大事每日头条芯闻 恩智浦计划退出5G功率放大器业务我国首..
实拍三菱全新欧蓝德!搭1.5T四缸,内饰配大屏,不比奇骏香?..
在重庆车展上,全新一代三菱欧蓝德终于在国内亮相了,相比其国外的发布时..
试驾广汽三菱奕歌:小巧灵动
■ 阅车试驾车型:广汽三菱奕歌长/宽/高(mm):4405/1805/1685轴距(mm..
新车 | 四驱越野MPV/配侧滑门/2.2T柴油机,新款三菱Delica D:5亮相..
文:懂车帝原创 高帅鹏[懂车帝原创 产品] 日前,2025东京车展开幕,新款..
三菱集团的传奇发家史
“三菱”两个字,在日本就像一把瑞士军刀:银行、飞机、汽车、火箭、寿司..
2026款三菱Montero曝光,S-AWC四驱+差速锁全配,普拉多见了..
当 “普拉多见了都得慌” 的话题在越野圈炸锅,2026 款三菱 Montero 的曝..
日韩巨擘数据,三星2.1万亿三菱21万亿,中国第一谁?..
图片来源于网络2025年,让人火大的资本较量又来一波。韩国三星手里握着2...
关于作者
巫月(普通会员)
文章
1621
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索