2025-06-25 11:07:01

谷歌发布Gemini Robotics On-Device 本地运行语言模型

摘要

谷歌DeepMind推出Gemini Robotics On-Device，可在无互联网环境下直接在机器人设备上运行，实现高效本地化控制。该模型基于3月发布的Gemini Robotics AI，支持自然语言指令操控，性能优于此前版本，推动机器人智能化新进展。

谷歌DeepMind于本周二正式发布全新语言模型Gemini Robotics On-Device，标志着机器人AI在本地化部署方面取得关键突破。

本地运行：摆脱网络依赖的智能控制

该模型专为边缘计算场景设计，能够在无互联网连接条件下直接在机器人硬件上运行。这一特性显著提升响应速度与系统可靠性，尤其适用于工业自动化、医疗辅助及户外作业等对实时性要求高的场景。通过将复杂AI推理任务下沉至设备端，有效降低延迟风险，增强隐私保护能力。

视觉-语言-动作一体化架构

Gemini Robotics On-Device基于今年3月推出的Gemini Robotics AI模型迭代而来，采用视觉-语言-动作（VLA）统一架构。该模型不仅能理解图像输入与自然语言指令，还能精准生成对应的动作序列，实现从感知到执行的闭环控制。其轻量化设计使其可在资源受限的嵌入式系统中高效运行，兼顾性能与能效。

开发者友好：自然语言微调提升适应性

开发者可通过简单自然语言提示对模型进行动态调整，快速适配不同任务需求。例如，仅用一句“请把红色盒子移到左边”即可引导机器人完成特定操作，大幅降低编程门槛。这种交互方式加速了机器人系统的开发周期，推动AI技术向更广泛行业渗透。

性能表现超越现有方案

根据谷歌内部测试数据，Gemini Robotics On-Device在多项基准任务中表现优于其他同类模型，尤其在复杂环境下的动作规划与多步任务执行方面具备明显优势。其高精度输出与低资源占用特性，为下一代自主机器人提供了坚实的技术支撑。

此次发布不仅展现了谷歌在机器人智能领域的持续投入，也预示着未来人机协作将更加自然、高效。随着模型逐步开放给开发者社区，预计将催生更多创新应用场景。

声明：文章不代表比特之家观点及立场，不构成本平台任何投资建议。投资决策需建立在独立思考之上，本文内容仅供参考，风险自担！转载请注明出处！侵权必究！