Google 推出 Gemini Robotics ER 1.6:SOTA 机器人模型,擅长视觉与空间推理

鏈新聞abmedia

Google DeepMind 发布了全新的机器人基础模型 Gemini Robotics ER 1.6,其中 ER 代表 Embodied Reasoning(具身推理)。该模型在视觉与空间推理方面达到了当前最佳水平(SOTA),并已通过 Gemini API 开放使用。Google AI 开发者关系负责人 Logan Kilpatrick 在社交媒体上公布了这项消息。(来源)

什么是 Embodied Reasoning?

Embodied Reasoning 是指 AI 模型理解并推理物理世界的能力。与传统的语言模型不同,具身推理模型需要处理三维空间中的物体位置、形状、材质与物理交互关系。Gemini Robotics ER 1.6 专门针对这类任务进行优化,使机器人能够更准确地理解周围环境并做出适当的动作决策。

核心能力

Gemini Robotics ER 1.6 的主要优势集中在两个方面:

能力 说明 视觉推理 能够从影像与视频中识别物体、理解场景结构,并据此进行决策 空间推理 理解三维空间中物体的相对位置、距离与方向,支持复杂的操作规划

这两项能力的结合让机器人能够处理更复杂的现实世界任务。例如,在仓储环境中,机器人需要同时识别不同形状的物品,并计算最佳的抓取角度与放置位置——这正是 Gemini Robotics ER 1.6 所擅长的场景。

通过 Gemini API 使用

与过去许多仅停留在论文阶段的机器人模型不同,Gemini Robotics ER 1.6 已经通过 Gemini API 提供访问。这意味着开发者与硬件厂商可以直接将这款模型整合到自己的机器人系统中,无需从零开始训练模型。

API 的开放也降低了机器人 AI 的开发门槛。过去,要开发一套具备视觉与空间推理能力的机器人系统需要大量的数据收集与模型训练工作。现在,开发者可以专注于硬件设计与应用场景的开发上,把底层的推理能力交给 Gemini Robotics ER 1.6 来处理。

Google 的机器人 AI 布局

Gemini Robotics ER 1.6 是 Google DeepMind 在机器人领域的最新成果。从早期的 RT-2 到现在的 Gemini Robotics 系列,Google 持续将大型语言模型的能力延伸到物理世界的交互中。ER 1.6 版本在前代基础上进一步提升了推理精度,尤其在需要精细操作的场景中表现更为出色。

随着机器人产业进入新一轮成长期,具备强大视觉与空间推理能力的基础模型将成为关键基础设施。想了解更多 Gemini 生态系统的发展,可以参考 Gemini 完整指南。

这篇文章 Google 推出 Gemini Robotics ER 1.6:SOTA 机器人模型,擅长视觉与空间推理 最早出现在 链新闻 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Sierra 募资 9.5 亿美元、估值 158 亿美元:Bret Taylor 以 OpenAI 主席身分抢夺 AI 客服龙头

Sierra 由 Bret Taylor 共同创办,宣布完成 9.5 亿美元 Series E、估值 158 亿美元,由 Tiger Global 与 GV 首投。8 季达成 1.5 亿 ARR、Fortune 50 渗透率超过 40%。定位为以 AI agent 为核心的垂直企业客服平台,提供即用型工作流。Taylor 同时为 OpenAI 董事长,治理与利益披露成焦点。

鏈新聞abmedia1小时前

Gemini API 推出 Webhooks:Google 解决长期任务轮询痛点、Batch/Veo 可即时推送

Google Gemini API 于 5 月 4 日推出 Webhooks。长任务完成时会自动将结果推送到 callback URL,替代轮询,降低资源和延迟、简化程序。适用于 Batch API、Veo2 和长 context 推理,特别适合 serverless。相较 OpenAI 偏 SSE、Anthropic 仍使用轮询,Google 强调开发者基础设施。未来关注安全机制与扩展模型。对台湾开发者而言,立即整合可显著降低 quota 和系统负载。

鏈新聞abmedia1小时前

Krutrim 于 5 月 5 日转向 AI 云服务,并发布首份盈利,随着 FY26 营收达到 3160 万美元

据 Press Trust of India 报道,印度 AI 公司 Krutrim 于 5 月 5 日将自身重新定位为本土 AI 云服务提供商,暂停芯片设计工作,并将资本和人才转向云基础设施。 该公司公布的 26 财年收入约为 30 亿卢比(US$31.6 m

GateNews2小时前

Anthropic、OpenAI 投资自 2026 年开始以来在零售加密交易中累计超过 11 亿美元

据彭博报道,自 2026 年初以来,散户投资者已向私营 AI 公司衍生品的杠杆交易投入约 11.3 亿美元。加密平台 Ventuals 和 PreStocks 支持 24 小时交易,包括 Anthropic、OpenAI 和 SpaceX 等公司,同时不授予直接的交易权限。

GateNews3小时前
评论
0/400
暂无评论