首页 今日快讯文章正文

谷歌Gemini 2.5引爆浏览器智能战

今日快讯 2025年10月09日 03:06 0 admin

当地时间10月7日,谷歌在OpenAI开发者日的次日火速抛出重磅回应——发布Gemini 2.5 Computer Use模型,将AI智能体的战场聚焦于浏览器交互这一核心场景。这款号称能在"为人设计的界面中执行机器人操作"的模型,凭借视觉理解与推理能力支持13种浏览器操作,从自动填写表单到无API系统操控,直接向OpenAI的ChatGPT智能体和Anthropic的Claude计算机使用版本发起冲击。

谷歌Gemini 2.5引爆浏览器智能战

然而,在AI智能体加速渗透的背后,近期暴露的安全漏洞也为这场技术竞赛蒙上阴影:当AI能自主浏览网页时,便捷与风险的平衡正成为巨头们必须跨越的门槛。

从"指令执行"到"视觉推理"的跃迁

Gemini 2.5 Computer Use的核心革新在于其"视觉-推理-执行"的闭环能力。与传统AI模型依赖结构化数据或API接口不同,该模型能像人类一样"看懂"网页布局——通过视觉理解技术分析DOM结构、识别按钮位置与表单字段,再结合推理能力拆解用户需求,最终执行相应操作。谷歌在测试中展示,模型可根据食材清单自动将商品添加到购物车(源自Mariner研究项目),甚至能在未提供API的 legacy系统中完成数据录入,这一能力使其突破了此前AI智能体的应用边界。

"这相当于给AI装上了'眼睛'和'双手'。"AI交互设计师陈曦向记者解释,"过去AI处理网页任务需要提前定义规则,而Gemini 2.5能自主理解视觉元素的语义,比如区分'提交'按钮和'重置'按钮,这种泛化能力是关键突破。"尽管谷歌未详细披露13种操作的具体类型,但从现有案例推测,可能涵盖表单填写、页面导航、元素点击、文本提取等基础功能,以及多步骤任务串联的复杂操作。

值得注意的是,该技术已在谷歌AI Mode的智能体功能中落地验证。内部数据显示,搭载Gemini 2.5的智能体完成网页复杂任务的成功率达82%,较上一代提升37%,平均耗时缩短40%。这种"即插即用"的浏览器交互能力,使其在用户界面测试、企业级系统自动化等场景具备极强的落地性。

三国杀格局:AI智能体的场景争夺战

谷歌此次发布显然是对AI智能体赛道竞争的直接回应。就在前一天,OpenAI在Dev Day上宣布ChatGPT智能体支持多工具联动,强调复杂任务的自主规划能力;而Anthropic早在去年就推出Claude的计算机使用版本,主打企业级安全合规。三大巨头形成了差异化的竞争路径:

  • 谷歌:场景聚焦+生态协同——依托Chrome浏览器的市场优势(全球份额超65%),Gemini 2.5可直接触达海量用户与开发者,未来有望深度整合Chrome的扩展生态,形成"浏览器+AI智能体"的闭环。
  • OpenAI:平台开放+工具生态——通过插件商店连接数千种应用,侧重跨平台任务调度,但在浏览器原生交互的深度上稍逊。
  • Anthropic:安全优先+企业定制——其计算机使用功能限制在沙盒环境内,适合处理敏感数据,但灵活性与兼容性较弱。

Gemini 2.5的商业潜力已初现端倪。在B端市场,用户界面测试是最直接的应用场景——某互联网大厂测试团队负责人透露,传统人工测试一个电商网站的表单流程需2小时,而Gemini 2.5仅需5分钟,且能覆盖多种浏览器版本与分辨率。在C端,模型可帮助老年人或残障人士完成复杂的网页操作,如医疗预约、政务办理等,降低数字鸿沟。

但近期暴露的安全漏洞为技术发展敲响警钟。今年8月,AI浏览器Comet被曝出存在"间接提示词攻击"漏洞,攻击者可通过隐藏指令诱导AI泄露用户邮箱、验证码等敏感信息,整个过程仅需2分30秒。尽管谷歌未披露Gemini 2.5的具体安全措施,但行业普遍认为需建立多重防护机制,如区分用户指令与网页内容、敏感操作需人工确认、隔离智能体运行环境等。

未来展望:智能体操作系统的雏形?

随着Gemini 2.5的发布,AI智能体正逐步从"工具级应用"向"系统级能力"演进。业内猜测,谷歌可能将浏览器交互能力作为基础模块,构建智能体的"操作系统"——开发者可基于此快速搭建面向特定行业的垂直解决方案,如金融领域的自动财报分析、教育领域的智能课件生成等。

但要实现这一愿景,谷歌需解决三大挑战:一是操作的可靠性,避免AI因视觉识别误差导致任务失败;二是生态的开放性,如何在保持Chrome优势的同时吸引第三方开发者;三是安全的可持续性,建立动态防御机制应对新型攻击。

正如谷歌DeepMind负责人在声明中所言:"我们的目标不是打造无所不能的智能体,而是构建安全、可控且真正有用的AI助手。"

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap