首页 抖音热门文章正文

上海AI出“编程核弹”!12小时18.7%金牌率,两倍效率碾压程序员

抖音热门 2025年10月22日 07:04 0 admin

只需要一半时间,就能完成更高质量的代码优化,这不是天方夜谭,而是上海人工智能实验室与华东师范大学最新研究成果带来的突破。

前言

2025年10月,上海人工智能实验室与华东师范大学联合发布了智能编程框架AutoMLGen。

该框架的核心创新在于其蒙特卡洛图搜索技术,使AI能够像人类团队一样,在不同解决方案路径间共享优化经验,从而显著提升代码优化效率。

在国际评测MLE-Bench中,AutoMLGen仅用标准时长一半的计算预算(12小时),便实现了36.4%的平均奖牌率与18.7%的金牌率,标志着AI编程从基础代码生成向高效算法优化的实质性迈进。

上海AI出“编程核弹”!12小时18.7%金牌率,两倍效率碾压程序员

AI编程的进化:从“写代码”到“优化代码”

当今的AI编程界面临一个尴尬局面:大模型能写出正确、优雅的代码,却难以在Kaggle等专业竞赛中取得优异成绩。原因在于,真实世界的机器学习任务不仅需要生成可运行的代码,更需要在数据处理、算法设计和性能调优方面进行持续迭代。

传统的AI编程工具存在两大痛点:一是缺乏领域专业知识,导致在庞大的解决方案空间中盲目探索;二是不同的尝试路径相互孤立,无法共享成功经验。这就好比一支队伍中的成员各自为战,从不交流心得体会。

上海人工智能实验室和华东师范大学一同拿下了这一难题。AutoMLGen框架的三大核心组件——领域知识库、蒙特卡洛图搜索和细粒度算子库,共同构建了一个能够自我进化的人工智能工程师。

知识库相当于一位经验丰富的导师,它系统整理了机器学习各方面的专业知识,从模型选择到数据处理技巧,再到竞赛策略,帮助AI在任务开始时就能站在巨人的肩膀上,避免从零开始的摸索。

上海AI出“编程核弹”!12小时18.7%金牌率,两倍效率碾压程序员

蒙特卡洛图搜索:让AI学会团队协作式的创新

AutoMLGen最核心的创新是蒙特卡洛图搜索技术。与传统线性搜索方式不同,这一技术允许不同搜索路径之间共享信息,实现了真正的“经验互通”。

蒙特卡洛图搜索通过四种机制推动AI不断进化:沿着当前路径继续探索的主扩展、从自身历史尝试中学习的分支内演化、借鉴其他路径成功经验的跨分支参考,以及融合多种方案优势的多分支聚合。这种结构让AI能够像人类团队一样,通过集体智慧快速找到最优解决方案。

实验数据显示,AutoMLGen 在 MLE-Bench 评测中只用了12小时计算时间(标准时长的一半),就实现了36.4%的平均奖牌率和 18.7% 的金牌率,位列第一。在更为轻量级的 MLE-Bench-Lite 测评中,它也拿出明显的领先优势。

这一框架的通用性也得到了验证——它与不同的基础大模型都能良好适配,在文本、图像和表格等多种任务类型上均表现优异。随着时间推移,其性能曲线快速上升并始终保持在高位,展现出强大的持续优化能力。

上海AI出“编程核弹”!12小时18.7%金牌率,两倍效率碾压程序员

结语

AutoMLGen的意义远不止于技术性能的提升,它代表了AI编程能力的一个根本性转变——从简单的代码生成升级为真正的算法理解和优化。

这种基于图结构的搜索逻辑与知识复用机制,为未来AI智能体的发展提供了可扩展的框架。

随着人工智能技术的不断成熟,像AutoMLGen这样能够自我反思、跨路径学习和融合创新解决方案的系统,正在为AI在更复杂场景中的应用铺平道路。

从算法发现到科研自动化,从工程设计到多智能体协作,这一理念正在扩展到更广泛的技术领域。

未来,这样的“AI工程伙伴”有望成为科学家和工程师的得力助手,共同推动技术创新边界不断向前迈进。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap