首页 AI科技文章正文

谷歌新机器人大脑,一句话搞定垃圾分类

AI科技 2025年09月28日 17:22 1 aa
谷歌新机器人大脑,一句话搞定垃圾分类

9月26日这天,谷歌DeepMind扔出了个让科技圈眼前一亮的东西,GeminiRobotics1.5系列机器人模型。

不用扯那些高深的技术名词,咱们就说个日常场景,你下班回家,桌上堆着喝完的饮料瓶、擦过手的纸巾、没吃完的水果皮。

随口跟机器人说“把这些按垃圾分类弄好”,它就会自己打开搜索查你所在小区的分类要求,然后有条不紊地把可回收物、干垃圾、湿垃圾分装进不同袋子。

谷歌新机器人大脑,一句话搞定垃圾分类

这可不是以前那种按固定程序走的“机械工”,这机器人明显带着“脑子”在干活,相当于同时装了“决策大脑”和“执行小脑”。

机器人大脑+小脑,俩模型搭伙干活

谷歌这次玩的是“双模型协作”,分工明明白白的。

先看GeminiRobotics1.5,它是VLA模型,咱们叫它“小脑”更接地气。

谷歌新机器人大脑,一句话搞定垃圾分类

它的任务就是把你说的话、它“看”到的画面,翻译成机器人肢体能执行的动作指令。

有意思的是,它不会上来就乱动手,会先在“内部”梳理流程,比如要拿桌上的玻璃杯,它会默默“盘算”,先确定杯子在桌面的哪个位置,再调整机械臂的抓手角度,碰到杯子后怎么用力才能拿稳还不摔碎。

要是你追问一句“为啥这么拿”,它还能把思路说给你听,比那些只会闷头干活、出了问题就卡壳的机器实在多了。

谷歌新机器人大脑,一句话搞定垃圾分类

另一个GeminiRobotics-ER1.5是VLM模型,这才是机器人的“指挥中心”,“大脑”。

它最擅长处理复杂任务,对现实世界的逻辑推理能力很突出。

你给它个有点挑战性的活儿,它能自动拆成好几个小步骤。

就拿垃圾分类来说,它第一步会先调用搜索工具查当地的具体规则,比如“酸奶盒要不要洗干净再扔”“外卖餐盒属于什么垃圾”。

谷歌新机器人大脑,一句话搞定垃圾分类

弄清楚后再规划操作顺序,先拿轻的纸巾,再拿硬的饮料瓶,最后处理易腐烂的水果皮。

有测试数据显示,它在空间理解方面的表现,比GPT-5这些当下热门的模型还要优秀。

谷歌新机器人大脑,一句话搞定垃圾分类

老实讲,这种“大脑+小脑”的搭配挺聪明。

“大脑”负责想战略,“小脑”负责搞执行,俩模型在一个框架里配合,复杂任务就被拆解成了能落地的动作。

现在开发者能通过GeminiAPI用那个“大脑”模型,“小脑”模型暂时只给部分合作伙伴用,看来谷歌也是在慢慢放开测试。

谷歌新机器人大脑,一句话搞定垃圾分类

关键黑科技,跨平台干活+遇事会变通

光分工清晰还不够,这系列模型有两个“硬核技能”才是真能耐。

第一个是动作迁移机制,简单说就是“学会一个技能,能在不同机器人身上用”。

以前可不是这样,机器人A花了好久学会开抽屉,机器人B想做同样的事,就得重新训练一遍,既费时间又费人力。

谷歌新机器人大脑,一句话搞定垃圾分类

但有了这个机制,在ALOHA机器人上练会的开抽屉技能,不用额外调试就能直接用到Apollo人形机器人上。

这就跟咱们学会骑自行车后,不管是男式车、女式车还是山地车,上去就能骑走一样,机器人的通用性一下就提高了不少。

谷歌新机器人大脑,一句话搞定垃圾分类

第二个是“具身思考”和“具身推理”,“具身思考”是“小脑”的本事,它干活前会用自然语言在心里列步骤。

比如让它收拾桌子,它会想“先拿杯子,再走到水槽边,然后放下杯子”。

要是杯子不小心掉了,它不会傻站着,会立刻调整步骤,先把杯子捡起来。

“具身推理”则是“大脑”的强项,它能判断任务干到哪了,会不会成功。

谷歌新机器人大脑,一句话搞定垃圾分类

比如你让它指桌子左下角的蓝杯子,它能精准定位,任务进行中还能实时调整计划。

如此看来,这俩能力加起来,机器人干活的灵活度和可靠性确实提升了不少。

安全有保障,行业要变天?

机器人这么“聪明能干”,安全肯定是绕不开的坎。

谷歌在这方面没含糊,搭了好几层安全防护网。

谷歌新机器人大脑,一句话搞定垃圾分类

既有管整体决策的顶层安全判断机制,比如碰到“拿尖锐物品”这类操作会自动评估风险,也有底层的防碰撞系统,避免机器人动胳膊时撞到人或东西。

他们还更新了ASIMOV安全测试基准,那个“大脑”模型在测试里表现很突出,对哪些动作安全、哪些不安全的判断更精准了。

这系列模型一推出,机器人行业的发展节奏估计得跟着变。

以前开发机器人模型,大多是盯着某一个机器人平台收集数据、做训练,换个硬件平台就没法用了,通用性特别差。

谷歌新机器人大脑,一句话搞定垃圾分类

现在谷歌用多本体数据加上动作迁移技术,相当于把机器人的“技能迁移通道”给打通了,机器人适应不同环境、不同硬件的能力也变强了。

本来以为这是谷歌的“独门绝技”,后来发现宇树开源的UnifoLM-WMA-0机器人模型,虽然内部的技术架构不一样,但也能适配好几种不同的机器人本体,看来跨本体化已经成了行业里大家都看好的方向。

毫无疑问,跨本体化已经成了机器人模型的新趋势。

谷歌新机器人大脑,一句话搞定垃圾分类

以后机器人可能不用再“专机专用”,一款模型能适配多种硬件,开发成本和落地难度都会降低。

想想看,未来家里的机器人能收拾家务,办公室的能整理文件,马路上的能帮忙垃圾分类、维护环境,这场景还真不远了。

总的来说,谷歌这次发布的GeminiRobotics1.5系列,不只是一次普通的技术更新,更像是给机器人装上了“会思考的大脑”和“灵活的手脚”。

谷歌新机器人大脑,一句话搞定垃圾分类

它打破了以往机器人“机械执行指令”的局限,证明机器也能像人一样带着变通的思维去解决实际问题。

现在行业里朝着跨本体化方向发展的厂商越来越多,不难预见,未来这些“聪明的机器人”会慢慢融入咱们的日常生活。

家里帮着收拾房间、处理垃圾,办公室协助整理文件、分发物品,马路上帮忙维护环境、分类垃圾,AIagents真正走进物理世界、服务咱们生活的日子,可能比咱们预想的还要快。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap