AI会自主探索？方滨兴院士从奖励函数看AI“意识”真相

排行榜 2025年11月03日 21:39 0 aa

当前，人工智能是否具备意识始终是业界争论焦点。在近日举行的中国中文信息学会2025学术年会暨第二届中国大模型大会上，中国工程院院士、广州大学教授方滨兴发表特邀报告，以“人工智能的奖励函数意味着什么？”为核心议题，从全新视角解读AI行为逻辑与“意识”争议，为通用人工智能（AGI）发展提供深刻思考，引发学界广泛关注。

“现在大家总问‘AI有没有意识’，其实先得搞明白AI是怎么‘做事’的。”方滨兴院士在报告里打了个形象的比方：人类做事常受“要活下去、要变好”的生存意识驱动，而AI的“行动指南”，其实是算法里的“目标函数”——就像给AI设定的“任务指令”。

他进一步解释，早年间的AI更像“按部就班的学生”：核心靠“损失函数”指导，比如算题错了就修正，全程按固定规则优化，行为完全是预设好的，根本谈不上“意识”，就像闹钟到点响、计算器按键出结果一样机械。

但随着“奖励函数”的出现，AI变“灵活”了。方滨兴院士说，这就像给AI换了种引导方式：不再是“错了才改”，而是“做得好就给奖励”——比如AI帮人写文案，写得贴合需求就给正向信号，写得差就没有，它会主动尝试不同写法去“争取奖励”。这种依赖奖励信号的决策过程，带了点“不确定性”和“探索性”，有时甚至会做出人类没预料到的反应。

“但千万别误会，这不是说AI有了‘自我意识’。”方滨兴强调，即便AI会“主动探索”，本质上还是在跟着“奖励规则”走，并没有真正的“想法”。不过他也提出，这种“因奖励而调整行为”的特性，确实让AI显露出类似“主观意志萌芽”的迹象，为我们理解AI技术的发展边界提供了新角度。（光明网记者宋雅娟）

来源：光明网