首页 AI科技文章正文

谷歌新机器人大脑，一句话搞定垃圾分类

AI科技 2025年09月28日 17:22 1 aa

谷歌新机器人大脑，一句话搞定垃圾分类

9月26日这天，谷歌DeepMind扔出了个让科技圈眼前一亮的东西，GeminiRobotics1.5系列机器人模型。

不用扯那些高深的技术名词，咱们就说个日常场景，你下班回家，桌上堆着喝完的饮料瓶、擦过手的纸巾、没吃完的水果皮。

随口跟机器人说“把这些按垃圾分类弄好”，它就会自己打开搜索查你所在小区的分类要求，然后有条不紊地把可回收物、干垃圾、湿垃圾分装进不同袋子。

谷歌新机器人大脑，一句话搞定垃圾分类

这可不是以前那种按固定程序走的“机械工”，这机器人明显带着“脑子”在干活，相当于同时装了“决策大脑”和“执行小脑”。

机器人大脑+小脑，俩模型搭伙干活

谷歌这次玩的是“双模型协作”，分工明明白白的。

先看GeminiRobotics1.5，它是VLA模型，咱们叫它“小脑”更接地气。

谷歌新机器人大脑，一句话搞定垃圾分类

它的任务就是把你说的话、它“看”到的画面，翻译成机器人肢体能执行的动作指令。

有意思的是，它不会上来就乱动手，会先在“内部”梳理流程，比如要拿桌上的玻璃杯，它会默默“盘算”，先确定杯子在桌面的哪个位置，再调整机械臂的抓手角度，碰到杯子后怎么用力才能拿稳还不摔碎。

要是你追问一句“为啥这么拿”，它还能把思路说给你听，比那些只会闷头干活、出了问题就卡壳的机器实在多了。

谷歌新机器人大脑，一句话搞定垃圾分类

另一个GeminiRobotics-ER1.5是VLM模型，这才是机器人的“指挥中心”，“大脑”。

它最擅长处理复杂任务，对现实世界的逻辑推理能力很突出。

你给它个有点挑战性的活儿，它能自动拆成好几个小步骤。

就拿垃圾分类来说，它第一步会先调用搜索工具查当地的具体规则，比如“酸奶盒要不要洗干净再扔”“外卖餐盒属于什么垃圾”。

谷歌新机器人大脑，一句话搞定垃圾分类

弄清楚后再规划操作顺序，先拿轻的纸巾，再拿硬的饮料瓶，最后处理易腐烂的水果皮。

有测试数据显示，它在空间理解方面的表现，比GPT-5这些当下热门的模型还要优秀。

谷歌新机器人大脑，一句话搞定垃圾分类

老实讲，这种“大脑+小脑”的搭配挺聪明。

“大脑”负责想战略，“小脑”负责搞执行，俩模型在一个框架里配合，复杂任务就被拆解成了能落地的动作。

现在开发者能通过GeminiAPI用那个“大脑”模型，“小脑”模型暂时只给部分合作伙伴用，看来谷歌也是在慢慢放开测试。

谷歌新机器人大脑，一句话搞定垃圾分类

关键黑科技，跨平台干活+遇事会变通

光分工清晰还不够，这系列模型有两个“硬核技能”才是真能耐。

第一个是动作迁移机制，简单说就是“学会一个技能，能在不同机器人身上用”。

以前可不是这样，机器人A花了好久学会开抽屉，机器人B想做同样的事，就得重新训练一遍，既费时间又费人力。

谷歌新机器人大脑，一句话搞定垃圾分类

但有了这个机制，在ALOHA机器人上练会的开抽屉技能，不用额外调试就能直接用到Apollo人形机器人上。

这就跟咱们学会骑自行车后，不管是男式车、女式车还是山地车，上去就能骑走一样，机器人的通用性一下就提高了不少。

谷歌新机器人大脑，一句话搞定垃圾分类

第二个是“具身思考”和“具身推理”，“具身思考”是“小脑”的本事，它干活前会用自然语言在心里列步骤。

比如让它收拾桌子，它会想“先拿杯子，再走到水槽边，然后放下杯子”。

要是杯子不小心掉了，它不会傻站着，会立刻调整步骤，先把杯子捡起来。

“具身推理”则是“大脑”的强项，它能判断任务干到哪了，会不会成功。

谷歌新机器人大脑，一句话搞定垃圾分类

比如你让它指桌子左下角的蓝杯子，它能精准定位，任务进行中还能实时调整计划。

如此看来，这俩能力加起来，机器人干活的灵活度和可靠性确实提升了不少。

安全有保障，行业要变天？

机器人这么“聪明能干”，安全肯定是绕不开的坎。

谷歌在这方面没含糊，搭了好几层安全防护网。

谷歌新机器人大脑，一句话搞定垃圾分类

既有管整体决策的顶层安全判断机制，比如碰到“拿尖锐物品”这类操作会自动评估风险，也有底层的防碰撞系统，避免机器人动胳膊时撞到人或东西。

他们还更新了ASIMOV安全测试基准，那个“大脑”模型在测试里表现很突出，对哪些动作安全、哪些不安全的判断更精准了。

这系列模型一推出，机器人行业的发展节奏估计得跟着变。

以前开发机器人模型，大多是盯着某一个机器人平台收集数据、做训练，换个硬件平台就没法用了，通用性特别差。

谷歌新机器人大脑，一句话搞定垃圾分类

现在谷歌用多本体数据加上动作迁移技术，相当于把机器人的“技能迁移通道”给打通了，机器人适应不同环境、不同硬件的能力也变强了。

本来以为这是谷歌的“独门绝技”，后来发现宇树开源的UnifoLM-WMA-0机器人模型，虽然内部的技术架构不一样，但也能适配好几种不同的机器人本体，看来跨本体化已经成了行业里大家都看好的方向。

毫无疑问，跨本体化已经成了机器人模型的新趋势。

谷歌新机器人大脑，一句话搞定垃圾分类

以后机器人可能不用再“专机专用”，一款模型能适配多种硬件，开发成本和落地难度都会降低。

想想看，未来家里的机器人能收拾家务，办公室的能整理文件，马路上的能帮忙垃圾分类、维护环境，这场景还真不远了。

总的来说，谷歌这次发布的GeminiRobotics1.5系列，不只是一次普通的技术更新，更像是给机器人装上了“会思考的大脑”和“灵活的手脚”。

谷歌新机器人大脑，一句话搞定垃圾分类

它打破了以往机器人“机械执行指令”的局限，证明机器也能像人一样带着变通的思维去解决实际问题。

现在行业里朝着跨本体化方向发展的厂商越来越多，不难预见，未来这些“聪明的机器人”会慢慢融入咱们的日常生活。

家里帮着收拾房间、处理垃圾，办公室协助整理文件、分发物品，马路上帮忙维护环境、分类垃圾，AIagents真正走进物理世界、服务咱们生活的日子，可能比咱们预想的还要快。

给量子做“低成本替身”！AI+13家机构出成果

摩尔定律的新考验，2025年，全球2nm芯片为何集体“跳票”

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved. sitemap