首页 排行榜文章正文

AI会自主探索?方滨兴院士从奖励函数看AI“意识”真相

排行榜 2025年11月03日 21:39 0 aa

当前,人工智能是否具备意识始终是业界争论焦点。在近日举行的中国中文信息学会2025学术年会暨第二届中国大模型大会上,中国工程院院士、广州大学教授方滨兴发表特邀报告,以“人工智能的奖励函数意味着什么?”为核心议题,从全新视角解读AI行为逻辑与“意识”争议,为通用人工智能(AGI)发展提供深刻思考,引发学界广泛关注。

AI会自主探索?方滨兴院士从奖励函数看AI“意识”真相

“现在大家总问‘AI有没有意识’,其实先得搞明白AI是怎么‘做事’的。”方滨兴院士在报告里打了个形象的比方:人类做事常受“要活下去、要变好”的生存意识驱动,而AI的“行动指南”,其实是算法里的“目标函数”——就像给AI设定的“任务指令”。

他进一步解释,早年间的AI更像“按部就班的学生”:核心靠“损失函数”指导,比如算题错了就修正,全程按固定规则优化,行为完全是预设好的,根本谈不上“意识”,就像闹钟到点响、计算器按键出结果一样机械。

但随着“奖励函数”的出现,AI变“灵活”了。方滨兴院士说,这就像给AI换了种引导方式:不再是“错了才改”,而是“做得好就给奖励”——比如AI帮人写文案,写得贴合需求就给正向信号,写得差就没有,它会主动尝试不同写法去“争取奖励”。这种依赖奖励信号的决策过程,带了点“不确定性”和“探索性”,有时甚至会做出人类没预料到的反应。

“但千万别误会,这不是说AI有了‘自我意识’。”方滨兴强调,即便AI会“主动探索”,本质上还是在跟着“奖励规则”走,并没有真正的“想法”。不过他也提出,这种“因奖励而调整行为”的特性,确实让AI显露出类似“主观意志萌芽”的迹象,为我们理解AI技术的发展边界提供了新角度。(光明网记者宋雅娟)

来源: 光明网

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap