文|杨泽原 许英博 丁奇 马庆刘下一代大模型(如GPT-5),有望成为决定本轮AI产业前景的关键变量。我们基于学术与产业界现有的成果与研讨方向,尝试建...
2025-08-05 0
德国慕尼黑亥姆霍兹人工智能研究所的科学家们开发出了一种革命性的AI系统,它能够以前所未有的精度预测人类在各种心理学实验中的行为选择。这个被命名为"Centaur"的模型通过学习超过1000万个人类决策数据,在32项不同的心理学任务中展现出了超越传统认知理论的预测能力,为认知科学研究开辟了新的技术路径。
传统的认知科学研究长期受限于单一任务模型的局限性。谷歌DeepMind的AlphaGo只能下围棋,前景理论只能预测人们在损失和收益之间的选择行为。这种专门化的方法虽然在特定领域表现出色,但无法提供对人类认知的全面理解。
Centaur的出现彻底改变了这一现状。该系统基于Meta公司的Llama大语言模型,通过一个名为"Psych 101"的大型行为数据集进行了为期五天的微调训练。这个数据集包含了160个心理学实验的结果,涉及60,000名参与者的行为选择数据。
研究团队的核心成员、认知科学家Marcel Binz表示:"你基本上可以用计算机来运行实验会话,而不是在真正的人类参与者上运行它们。"这种方法在传统研究速度过慢,或者难以招募儿童或患有精神疾病的特殊群体时显得尤为有价值。
该模型的训练策略独具匠心。研究人员不仅让Centaur学习预测给定任务的平均行为,还训练它预测人群中典型行为的范围分布。这种设计使得模型能够捕捉到人类行为的复杂性和多样性,而不是简单地输出一个统一的预测结果。
Centaur最令人印象深刻的特征是其出色的泛化能力。在测试阶段,该模型不仅在训练数据覆盖的任务中表现优异,更重要的是,它能够准确预测人们在完全未接受过训练的任务中的选择行为。
在32项测试任务中,Centaur在除一项之外的所有任务中都优于原始的Llama模型和14个传统的认知统计模型。唯一的例外是一项要求参与者判断句子语法正确性的任务。这一结果表明,该模型已经学会了某种程度上的"通用认知原理",能够将从一个领域学到的知识迁移到其他相关领域。
斯坦福大学认知神经科学家Russell Poldrack对此评价道:"这表明人类行为有很多结构。它确实提高了心理学应该追求的那种模型的力量。"
更令人惊讶的是,Centaur在面对与训练任务截然不同的挑战时依然表现出色。例如,在逻辑推理任务中,尽管这类任务与其训练数据中的任何任务都不相似,但模型仍能准确预测人类的选择模式。
Centaur的成功开发为认知科学研究提供了一个强大的新工具。传统的心理学实验往往需要大量的时间、资源和参与者,而且在某些特殊情况下难以进行。例如,研究儿童认知发展或精神疾病患者的行为模式时,招募合适的参与者常常面临伦理和实际困难。
挪威科技大学的心理语言学家Giosuè Baggio表示:"在认知科学中构建理论非常困难。看到我们在机器的帮助下能想出什么,真是令人兴奋。"
该模型的应用前景广阔。研究人员可以使用Centaur来快速测试新的理论假设,探索不同条件下的人类行为模式,甚至设计更有效的心理学实验。这种方法可能会显著加速认知科学的发展进程。
更重要的是,Centaur为理解人类认知的本质提供了新的视角。通过分析模型的内部表示和决策过程,科学家们可能能够识别出人类思维的共同模式和潜在机制。
尽管Centaur展现出了令人瞩目的能力,但研究团队也坦承该系统存在明显的局限性。Poldrack指出,该AI模型完全依赖于基于语言的任务,无法预测人类决策的时间维度。例如,虽然它能预测一个人在特定任务中可能做出什么选择,但无法预测他们需要多长时间来做出这个选择。
此外,当前的训练数据主要来自西方、受过教育的工业化人群,这可能会限制Centaur对不同文化背景群体的预测准确性。研究团队已经意识到这个问题,正在努力扩展训练数据集,目标是将其规模扩大到现有数据集的四倍。
数据来源的多样性是另一个重要挑战。为了提高模型的普适性,研究人员需要收集来自不同文化背景、年龄段和社会经济地位的参与者数据。这不仅是一个技术挑战,也涉及跨文化研究的复杂性。
Binz表示,免费开放的Centaur的下一步发展需要研究界的外部验证。"现在,这可能是我们有史以来最糟糕的Centaur版本,而且它只会从这里变得更好。"这种开放的态度体现了科学研究的协作精神,也为该技术的进一步发展铺平了道路。
研究团队计划在未来版本中加入更多的认知任务类型,包括情感决策、社会认知和创造性思维等领域。他们还希望探索如何将模型扩展到非语言任务,例如视觉空间推理和运动控制等。
Centaur的成功标志着人工智能与认知科学结合的新里程碑。它不仅为理解人类思维提供了新的工具,也为开发更加人性化的AI系统奠定了基础。随着技术的不断完善和数据集的持续扩展,这种类型的AI模型可能会在未来的认知科学研究中发挥越来越重要的作用。
论文地址:https://doi.org/10.1038/s41586-025-09215-4 (2025)。
相关文章
文|杨泽原 许英博 丁奇 马庆刘下一代大模型(如GPT-5),有望成为决定本轮AI产业前景的关键变量。我们基于学术与产业界现有的成果与研讨方向,尝试建...
2025-08-05 0
金融界2025年8月4日消息,国家知识产权局信息显示,深圳如般微电子有限公司申请一项名为“一种量子加密指挥调度系统及控制方法”的专利,公开号CN120...
2025-08-05 0
德国慕尼黑亥姆霍兹人工智能研究所的科学家们开发出了一种革命性的AI系统,它能够以前所未有的精度预测人类在各种心理学实验中的行为选择。这个被命名为"Ce...
2025-08-05 0
Dorisoy.SIOTDorisoy.SIOT 是一款.Net8.0下使用 MAUI 框架开发的跨平台牙科治疗机物联网移动端应用程序,实现了水温检测...
2025-08-05 0
Hello,大家好!我是沈少!在刚刚逛完的ChinaJoy 2025展会中,我也重点看了铠侠的展台。相信熟悉存储产品发展史的小伙伴们肯定对这个品牌很熟...
2025-08-05 0
都说现在文艺复兴,很多“洋垃圾”的CCD老相机被小仙女们炒到天价,而很多老随身听也被老男人们炒到起飞。尤其是索尼的Walkman产品,横跨MP3、MD...
2025-08-05 0
连日来,桥西区以“人工智能+政务服务”改革引领政务服务效能优化,成功将D e e p S e e k大模型融入桥西区特色数字化政务服务平台“政务服务云...
2025-08-05 0
金融界2025年7月29日消息,国家知识产权局信息显示,浙江三网科技股份有限公司申请一项名为“一种基于AI社工的走访服务实现方法及系统”的专利,公开号...
2025-08-05 0
发表评论