Nature：一种革命性的AI系统，能以前所未有的精度预测人类选择

AI科技 2025年08月05日 02:56 0 admin

德国慕尼黑亥姆霍兹人工智能研究所的科学家们开发出了一种革命性的AI系统，它能够以前所未有的精度预测人类在各种心理学实验中的行为选择。这个被命名为"Centaur"的模型通过学习超过1000万个人类决策数据，在32项不同的心理学任务中展现出了超越传统认知理论的预测能力，为认知科学研究开辟了新的技术路径。

跨越单一任务的认知建模突破

传统的认知科学研究长期受限于单一任务模型的局限性。谷歌DeepMind的AlphaGo只能下围棋，前景理论只能预测人们在损失和收益之间的选择行为。这种专门化的方法虽然在特定领域表现出色，但无法提供对人类认知的全面理解。

Centaur的出现彻底改变了这一现状。该系统基于Meta公司的Llama大语言模型，通过一个名为"Psych 101"的大型行为数据集进行了为期五天的微调训练。这个数据集包含了160个心理学实验的结果，涉及60,000名参与者的行为选择数据。

研究团队的核心成员、认知科学家Marcel Binz表示："你基本上可以用计算机来运行实验会话，而不是在真正的人类参与者上运行它们。"这种方法在传统研究速度过慢，或者难以招募儿童或患有精神疾病的特殊群体时显得尤为有价值。

该模型的训练策略独具匠心。研究人员不仅让Centaur学习预测给定任务的平均行为，还训练它预测人群中典型行为的范围分布。这种设计使得模型能够捕捉到人类行为的复杂性和多样性，而不是简单地输出一个统一的预测结果。

超越训练数据的泛化能力

Centaur最令人印象深刻的特征是其出色的泛化能力。在测试阶段，该模型不仅在训练数据覆盖的任务中表现优异，更重要的是，它能够准确预测人们在完全未接受过训练的任务中的选择行为。

在32项测试任务中，Centaur在除一项之外的所有任务中都优于原始的Llama模型和14个传统的认知统计模型。唯一的例外是一项要求参与者判断句子语法正确性的任务。这一结果表明，该模型已经学会了某种程度上的"通用认知原理"，能够将从一个领域学到的知识迁移到其他相关领域。

斯坦福大学认知神经科学家Russell Poldrack对此评价道："这表明人类行为有很多结构。它确实提高了心理学应该追求的那种模型的力量。"

更令人惊讶的是，Centaur在面对与训练任务截然不同的挑战时依然表现出色。例如，在逻辑推理任务中，尽管这类任务与其训练数据中的任何任务都不相似，但模型仍能准确预测人类的选择模式。

Centaur的成功开发为认知科学研究提供了一个强大的新工具。传统的心理学实验往往需要大量的时间、资源和参与者，而且在某些特殊情况下难以进行。例如，研究儿童认知发展或精神疾病患者的行为模式时，招募合适的参与者常常面临伦理和实际困难。

挪威科技大学的心理语言学家Giosuè Baggio表示："在认知科学中构建理论非常困难。看到我们在机器的帮助下能想出什么，真是令人兴奋。"

该模型的应用前景广阔。研究人员可以使用Centaur来快速测试新的理论假设，探索不同条件下的人类行为模式，甚至设计更有效的心理学实验。这种方法可能会显著加速认知科学的发展进程。

更重要的是，Centaur为理解人类认知的本质提供了新的视角。通过分析模型的内部表示和决策过程，科学家们可能能够识别出人类思维的共同模式和潜在机制。

技术局限与未来发展

尽管Centaur展现出了令人瞩目的能力，但研究团队也坦承该系统存在明显的局限性。Poldrack指出，该AI模型完全依赖于基于语言的任务，无法预测人类决策的时间维度。例如，虽然它能预测一个人在特定任务中可能做出什么选择，但无法预测他们需要多长时间来做出这个选择。

此外，当前的训练数据主要来自西方、受过教育的工业化人群，这可能会限制Centaur对不同文化背景群体的预测准确性。研究团队已经意识到这个问题，正在努力扩展训练数据集，目标是将其规模扩大到现有数据集的四倍。

数据来源的多样性是另一个重要挑战。为了提高模型的普适性，研究人员需要收集来自不同文化背景、年龄段和社会经济地位的参与者数据。这不仅是一个技术挑战，也涉及跨文化研究的复杂性。

Binz表示，免费开放的Centaur的下一步发展需要研究界的外部验证。"现在，这可能是我们有史以来最糟糕的Centaur版本，而且它只会从这里变得更好。"这种开放的态度体现了科学研究的协作精神，也为该技术的进一步发展铺平了道路。

研究团队计划在未来版本中加入更多的认知任务类型，包括情感决策、社会认知和创造性思维等领域。他们还希望探索如何将模型扩展到非语言任务，例如视觉空间推理和运动控制等。

Centaur的成功标志着人工智能与认知科学结合的新里程碑。它不仅为理解人类思维提供了新的工具，也为开发更加人性化的AI系统奠定了基础。随着技术的不断完善和数据集的持续扩展，这种类型的AI模型可能会在未来的认知科学研究中发挥越来越重要的作用。

论文地址：https://doi.org/10.1038/s41586-025-09215-4 （2025）。

这个发誓不用Java的程序员，终于受到惩罚了......

DeepMind：智能体就是世界模型！跟Ilya 2年前预言竟不谋而合

发表评论