近日,美国博主克里斯蒂安·格罗西在张家界国家森林公园体验了一款行走辅助外骨骼机器人,其发布的体验视频在国外社交平台引发轰动。视频中,格罗西惊叹“这就是...
2025-10-03 0
潮新闻客户端 记者 张云山
9月26日,据全球权威评测基准BIRD-Bech官网,蚂蚁数科的数据分析智能体Agentar-SQL超越诸多国内外厂商,位居全球第一。
蚂蚁数科登顶国际权威BIRD榜单(受访者供图)
BIRD-Bench是公认的全球最具权威性的自然语言转SQL评测基准,要求AI大模型将自然语言查询转换为结构化查询语言(SQL),并且在真实复杂的大规模生产级数据库中稳定执行。BIRD--Bench数据集覆盖金融、电力、医疗等37个行业场景,总量33GB,包含超过1万条高复杂度查询任务,是全球顶级AI团队展示技术实力的权威平台。
值得一提的是,蚂蚁数科Agentar-SQL在BIRD榜单的执行准确率排行榜(81.67分)以及执行效率榜上(77分)上均取得第一的成绩。
据介绍,Agentar-SQL智能体基于蚂蚁数科的SQL大模型Agentar-Scale-SQL构建,旨在让用户可以通过自然语言轻松完成复杂的数据查询任务。它通过GSPO(组序列策略优化)强化学习训练方法,能够增强SQL内在推理,让大模型在推理阶段,深度思考SQL框架,避免潜在的逻辑错误,提升SQL逻辑准确性;此外,Agentar-SQL具备多轮反思修正的能力,让模型对生成的SQL进行多轮次的审视和修正,提升SQL语言的精准性;Agentar-SQL还通过独创的两阶段生成法,让大模型生成多个SQL候选,再对SQL进行两两PK的“锦标赛”,筛选出最优的SQL。
蚂蚁数科持续深耕AI大模型技术与应用,此前其自研的金融推理大模型Agentar-Fin-R1,在多项主流金融基准测试实现领先。
“转载请注明出处”
相关文章
近日,美国博主克里斯蒂安·格罗西在张家界国家森林公园体验了一款行走辅助外骨骼机器人,其发布的体验视频在国外社交平台引发轰动。视频中,格罗西惊叹“这就是...
2025-10-03 0
来源:环球市场播报OpenAI宣布,“今日我们对埃隆・马斯克最新的、披着诉讼外衣的骚扰手段作出了回应。OpenAI不需要也不想要任何人的商业机密。我们...
2025-10-03 0
潮新闻客户端 记者 张云山9月26日,据全球权威评测基准BIRD-Bech官网,蚂蚁数科的数据分析智能体Agentar-SQL超越诸多国内外厂商,位居...
2025-10-03 0
微乐陕西麻将怎么让系统发好牌是 一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加微下载使用。 手机打牌可以一键让你轻松...
2025-10-03 14
微信小程序打麻将开挂辅助器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加微下载使用。 手机打牌可以一键让你轻松成为...
2025-10-03 15
微乐四川麻将助赢神器购买是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加微下载使用。 手机打牌可以一键让你轻松成为“...
2025-10-03 13
微乐够级怎么拿到好牌是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加微下载使用。 手机打牌可以一键让你轻松成为“必赢...
2025-10-03 13
财神十三张新号稳赢是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加微下载使用。 手机打牌可以一键让你轻松成为“必赢”...
2025-10-03 15
发表评论