首页 AI科技文章正文

计算机行业观察:字节跳动GR-3革新家庭机器人;OpenAI与DeepMind首夺IMO金牌

AI科技 2025年07月28日 02:13 0 aa

7月22日至25日,全球科技领域迎来两项突破性进展:字节跳动发布通用机器人操作大模型GR-3,而OpenAI与谷歌DeepMind则在国际数学奥林匹克(IMO)竞赛中首次斩获金牌。这两项进展分别代表机器人技术在多模态融合能力上的跃升,以及AI模型在复杂逻辑推理领域的新高度。

字节跳动GR-3:家庭场景的泛化能力突破

字节跳动Seed团队推出的GR-3大模型,通过融合视觉、语言与动作信息,实现了对抽象指令的理解与长程任务的稳定执行。该模型采用遥操作、人类VR轨迹与图文数据三类训练方式,其配套机器人ByteMini凭借22个自由度的灵活手腕结构,可在家庭场景中完成餐桌清理、衣物整理等精细化操作。测试结果显示,GR-3在新物体识别、复杂指令解析及动态环境适应性方面均优于现有VLA(视觉-语言-动作)模型。

在技术路径上,GR-3通过多模态数据对齐解决了传统机器人依赖预设程序的局限性。例如,在挂衣任务中,模型可自主分解动作步骤,结合视觉反馈调整抓取力度,避免对衣物的损伤。团队表示,未来计划通过扩大数据规模与引入强化学习机制,进一步提升机器人对未知场景的适应能力。

这一突破标志着家庭服务机器人从“单一功能执行”向“泛化任务处理”的转型。与工业机器人不同,家庭场景的复杂性与非结构化特征对模型的抗干扰能力提出更高要求。GR-3的推出或将为家庭服务机器人商业化落地提供技术基准。

OpenAI与DeepMind:AI模型首登IMO金牌榜

7月20日,IMO竞赛首次公布AI模型参赛成绩:OpenAI与DeepMind以35分(满分42分)并列金牌,刷新AI在数学证明领域的极限。其中,DeepMind搭载“DeepThink”推理模块的Gemini进阶版,在4.5小时内完成全部六题中的五道完整解答,并展示多路径推理能力;OpenAI模型则超越此前Gemini2.5Pro的纪录,在几何与数论题中实现零误差输出。

此次竞赛中,AI模型需将自然语言命题转化为形式化数学证明代码。OpenAI通过强化训练语言模型与Lean验证器的协同,提升了解题准确率;而DeepMind的“并行思维路径”设计允许模型同时探索多种解法,最终选择最优策略。值得注意的是,字节跳动Seed团队研发的SeedProver以30分获得银牌,其基于自然语言与形式化代码交互的验证方法,为AI数学推理提供了新思路。

IMO成绩的公布,标志着AI在复杂逻辑推理领域已接近人类顶尖水平。尽管当前模型仍依赖大量标注数据与特定领域训练,但其在跨学科问题上的泛化能力提升,为AI在科研、教育等场景的应用开辟了可能性。未来,如何降低模型对标注数据的依赖,或将成为技术攻坚的核心方向。

本文源自金融界

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap