2025年7月,国际数据公司(IDC)发布最新季度报告显示,2025年第二季度中国智能手机市场出货量达6900万部,同比下滑了4%。尽管整体市场仍处调...
2025-07-26 0
谷歌DeepMind近日发布了一项可能重塑机器人行业格局的关键技术——Gemini Robotics On-Device。这是一个先进的视觉-语言-行动(VLA)基础模型,其核心突破在于能够完全在机器人硬件上本地运行。此举直接解决了长期以来困扰实用机器人部署的延迟和网络连接两大瓶颈,被业界视为推动“具身智能”从实验室走向现实世界的关键一步,甚至可能催生期待已久的“机器人的ChatGPT时刻”。
长期以来,尽管AI在云端的能力日新月异,但物理世界中的机器人发展却步履维艰。其根本症结在于,大多数先进的机器人大脑依赖于云端服务器的强大算力。这种模式下,机器人通过传感器感知环境,将数据上传至云端进行分析决策,再接收指令执行动作。然而,这一过程中的网络延迟是致命的。对于一个正在执行精细操作的机器人而言,哪怕是几百毫秒的延迟,都可能导致任务失败甚至造成物理损坏。此外,对稳定网络连接的依赖,也极大地限制了机器人在工厂、仓库、家庭或户外等网络信号不佳或不存在的环境中的应用。
Gemini Robotics On-Device的问世,正是为了打破这一范式。通过将强大的基础模型直接部署在机器人本地硬件上,它实现了低延迟的实时推理。这意味着机器人可以即时响应环境变化,独立完成复杂任务,而无需依赖任何外部网络。这不仅是技术架构的一次重大演进,更是机器人迈向真正自主性的关键前提。正如Google DeepMind所强调的,这一解决方案将帮助机器人社区应对至关重要的延迟与连接挑战,从而在根本上提升机器人的实用性和可靠性。
Gemini Robotics On-Device隶属于谷歌今年早些时候发布的Gemini Robotics模型家族,该家族基于强大的Gemini 2.0多模态大语言模型构建,并创新性地加入了“物理行动”作为输出模态。它不仅仅能理解文本和图像,更能将这种理解转化为一系列可执行的物理指令。
而此次发布的On-Device版本,最大的亮点在于其是该系列中首个支持“微调”(fine-tuning)的模型。通用基础模型固然强大,但现实世界的任务往往需要高度的专业化。DeepMind展示了该模型惊人的适应能力:开发者仅需提供少至50个任务演示,就能让机器人掌握一项全新的复杂技能。
在一系列涵盖食物准备、打牌等七项不同任务的测试中,经过微调的Gemini Robotics On-Device模型表现卓越。其平均任务成功率接近80%,显著超过了当前最先进的同类设备上视觉-语言-行动模型(成功率约为60%)。这一数据有力地证明,该模型不仅解决了本地化运行的难题,更提供了一条高效、低成本的路径,让机器人能够快速适应并精通特定的应用场景。这种强大的微调能力,极大地降低了开发和部署专用机器人的门槛。
Gemini Robotics On-Device的发布在开发者社区引发了热烈反响。在Hacker News等技术论坛上,许多人认为这可能就是业界翘首以盼的“机器人的ChatGPT时刻”。一位开发者精辟地指出,其潜力在于,像Gemini这样的多模态大模型已经内建了对世界海量的常识性理解。它已经知道什么是“草坪”、什么是“玩具”、什么是“修剪”。
因此,微调的过程不再是“从零开始”教机器人认识世界,而更像是在其已有的庞大知识库之上,教它如何将这些抽象概念与特定硬件(如一台割草机)的具体操作指令序列关联起来。这解释了为何仅需少量演示就能取得显著效果。这种“知识迁移”的模式,是从抽象理解到物理行动的桥梁,也是通用人工智能(AGI)在物理世界具身化的核心体现。
为了支撑这一生态的健康发展,DeepMind还配套发布了Gemini Robotics SDK(软件开发工具包),并建立了包括用于评估机器人安全机制的ASIMOV基准和用于衡量视觉推理能力的ERQA评估数据集在内的完整工具链。这表明谷歌的雄心并非发布单个模型,而是构建一个完善、开放的机器人基础平台,赋能整个开发者社区。
尽管Gemini Robotics On-Device目前尚未全面开放,开发者需要通过注册等待名单来获取访问权限,但它的出现已经为具身智能的未来描绘了一幅清晰的蓝图。通过将智能从云端解放到终端,并赋予其快速适应新任务的能力,这项技术有望催生出新一代更自主、更灵巧、更实用的机器人,真正将人工智能的力量带入我们的物理生活。
相关文章
2025年7月,国际数据公司(IDC)发布最新季度报告显示,2025年第二季度中国智能手机市场出货量达6900万部,同比下滑了4%。尽管整体市场仍处调...
2025-07-26 0
原标题:智能眼镜,你会买吗?眼镜产业是江西省鹰潭市余江区的传统产业。图为在该区拍摄的一家公司生产的智能眼镜产品。 新华社记者 刘金海摄不仅可以让人看得...
2025-07-26 0
金融界2025年7月26日消息,国家知识产权局信息显示,广州斯智生物科技有限公司取得一项名为“样本精控仪及其使用方法”的专利,授权公告号CN11294...
2025-07-26 0
△名为“活茧”的棺材在传统葬礼方式之外,如今出现了一种新选择。荷兰生物科技公司Loop Biotech近日推出全球第一款“活棺材”,这种创新产品采用纯...
2025-07-26 0
韩国人靠卖“电脑内存条”半年狂赚67亿美元,这钱比印钞机还快?SK海力士刚交出的成绩单直接炸了锅:Q2营业利润暴增68%,净利润近7万亿韩元,营收创历...
2025-07-26 0
7月25日,国产GPU厂商摩尔线程在上海举办以“算力进化,精度革命”为主题举办技术分享会,并提出“AI工厂”理念。摩尔线程创始人兼CEO张建中在主题演...
2025-07-26 0
金融界2025年7月25日消息,国家知识产权局信息显示,郑州云海信息技术有限公司取得一项名为“一种任务的处理方法、装置、设备和计算机可读存储介质”的专...
2025-07-26 0
证券之星消息,根据天眼查APP数据显示通易航天(871642)新获得一项发明专利授权,专利名为“一种采用高周波焊接的异型空投水囊生产工艺”,专利申请号...
2025-07-26 0
发表评论