首页 今日快讯文章正文

离线学习被骂没创意?交大团队给AI加多样性buff,代码准确率暴增​

今日快讯 2025年10月07日 12:06 0 aa

AI生成代码总被吐槽“答案都一个样”,问题不在模型,在离线学习这门“老方法”。

作为代码生成的常用技术,它提前生成数据再训练,虽省算力,却让模型习惯“复制粘贴”,生成的候选答案高度相似。

上海交大团队针对这一痛点,用个巧招儿让AI学会“变花样”,在离线学习里加了鼓励多样性的设计,效果立竿见影。

离线学习被骂没创意?交大团队给AI加多样性buff,代码准确率暴增​

AI写代码总“抄作业”,这事儿你肯定遇过!

最近跟做程序员的老周吃饭,他举着手机吐槽:“现在AI写代码是快,Cursor、Gemini CLI敲两句就出段程序,但你要让它生成3个候选答案?

呵呵,十个里有八个都用同一个框架,剩下俩也就换个变量名,跟复制粘贴似的!”

我乐了:“这不怪AI,是‘离线学习’这老办法的锅。”

啥叫离线学习?简单说就是提前让AI生成一堆数据存着,之后再训练

好处是省算力,不用边用边学。但问题也明显:AI像个死记硬背的学生,只会“照本宣科”。

比如让AI写“用户登录验证”的代码,生成的候选答案全是一个模子,先查用户名,再核密码,最后返回状态。

这时候再用“测试时拓展”,其实根本没得选!答案都差不多,准确率能上去才怪。

老周拍大腿:“可不是嘛!我之前用这方法调模型,费了半天劲,结果还不如自己写的一半好用!”

加了个“多样性开关”,AI突然会“变招”了!

那咋让AI生成“不一样”的答案?上海交大的郁家豪团队想了个不换模型、改规则的招儿,给离线学习的“损失项”里加了点“料”:逼AI别偷懒,必须生成不同的回答。

打个比方,就像老师布置作业:不光看答案对不对,还得看“有没有新解法”。要是全班都写一样的步骤,就算对了也得扣分!

离线学习被骂没创意?交大团队给AI加多样性buff,代码准确率暴增​

可做实验得有数据啊。一开始团队想用来Claude Sonnet4,结果采了100条数据就花了500美元,算下来完整采集得1万刀,课题组预算直接不够!

巧的是,刚好赶上国产模型爆发:Kimi、Qwen、GLM这些模型又便宜又好用。

团队试着用GLM-4.5采数据,嘿,性能跟Claude差不多,关键是人家有个“1万亿token试用套餐”,一个月才几十块!最后采集数据就花了50块钱,跟喝杯奶茶似的。

然后用国产Qwen3-coder-30B微调,结果出来了,在AI圈“硬核考试”SWE-Bench里,模型直接冲上Verified榜第4、Lite榜第1

老周看完结果眼睛都亮了:“这招儿神了!以后AI给我生成代码,能拿到3种不同写法,我挑个最顺手的就行!”

更绝的是,这方法不止能写代码:

  • 教AI做数学竞赛题,以前只给1种解法,现在能出3种不同思路,孩子随便挑个会的;
  • 写创意文案,AI再也不套“开头问句、结尾喊口号”的模板了,能写出点“有脑子”的东西;
  • 甚至连CTF夺旗赛(网络攻防),AI都能生成不同的攻击路径,多试几次说不定就通关了!

结语

其实这研究哪是单纯“改代码”?它是给AI装了个“脑洞开关”,让AI从“只会重复的工具”,变成“能帮人想新办法的伙伴”。

更有意思的是国模的逆袭:以前大家总觉得开源得看Llama,现在Qwen、GLM用实力证明:咱国产模型不比闭源差,价格还便宜100倍

对咱们普通人来说,这意味着啥?以后用AI写文案,能拿到新鲜的句子;让孩子学数学,AI能给多种解法;甚至修电脑写脚本,AI都能整出点“不一样的招儿”。

AI的本质,不就是帮人“省力气、开脑洞”吗?郁家豪团队这招儿,不光解决了技术痛点,更让AI“活”了起来,不再是冷冰冰的代码,而是能跟你一起“想办法”的帮手。

你说,这样的AI,是不是才真正有用?

下次再遇到AI“抄作业”,别急着骂,说不定哪天,它就给你整出个“惊喜解法”呢!

离线学习被骂没创意?交大团队给AI加多样性buff,代码准确率暴增​

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap