AI自发形成人类级认知！自动化所团队揭示多模态大模型涌现类人物体概念表征

来源：中国日报网 2025-06-09 21:39

分享到微信

中国日报6月9日电（记者李梦涵）人类能够对自然界中的物体进行概念化，这一认知能力长期以来被视为人类智能的核心。当我们看到"狗""汽车"或"苹果"时，不仅能识别它们的物理特征（尺寸、颜色、形状等），还能理解其功能、情感价值和文化意义——这种多维度的概念表征构成了人类认知的基石。随着ChatGPT等大语言模型（LLMs）的爆发式发展，一个根本性问题浮出水面：这些大模型能否从语言和多模态数据中发展出类似人类的物体概念表征？

近日，中国科学院自动化研究所神经计算与脑机交互（NeuBCI）课题组与中国科学院脑科学与智能技术卓越创新中心的联合团队结合行为实验与神经影像分析，首次证实多模态大语言模型（MLLMs）能够自发形成与人类高度相似的物体概念表征系统。这项研究不仅为人工智能认知科学开辟了新路径，更为构建类人认知结构的人工智能系统提供了理论框架。相关研究成果以Human-like object concept representations emerge naturally in multimodal large language models为题，发表于《自然·机器智能》（Nature Machine Intelligence）。

传统人工智能研究聚焦于物体识别准确率，却鲜少探讨模型是否真正"理解"物体含义。论文通讯作者何晖光研究员指出："当前AI能区分猫狗图片，但这种'识别'与人类'理解'猫狗的本质区别仍有待揭示。"团队从认知神经科学经典理论出发，设计了一套融合计算建模、行为实验与脑科学的创新范式。研究采用认知心理学经典的"三选一异类识别任务"（triplet odd-one-out），要求大模型与人类从物体概念三元组（来自1854种日常概念的任意组合）中选出最不相似的选项。通过分析470万次行为判断数据，团队首次构建了AI大模型的"概念地图"。

研究人员从海量大模型行为数据中提取出66个"心智维度"，并为这些维度赋予了语义标签。研究发现，这些维度是高度可解释的，且与大脑类别选择区域（如处理面孔的FFA、处理场景的PPA、处理躯体的EBA）的神经活动模式显著相关。

研究还对比了多个模型在行为选择模式上与人类的一致性（Human consistency）。结果显示，多模态大模型（如 Gemini_Pro_Vision、Qwen2_VL）在一致性方面表现更优。此外，研究还揭示了人类在做决策时更倾向于结合视觉特征和语义信息进行判断，而大模型则倾向于依赖语义标签和抽象概念。本研究表明大语言模型并非"随机鹦鹉"，其内部存在着类似人类对现实世界概念的理解。

自动化所副研究员杜长德为论文第一作者，何晖光研究员为论文通讯作者。主要合作者还包括脑智卓越中心的常乐研究员等。该研究得到了中国科学院基础与交叉前沿科研先导专项、国家自然科学基金、北京市自然科学基金项目以及脑认知与类脑智能全国重点实验室的资助。

【责任编辑：邵冰琦】

专题

推荐阅读

关于我们 | 联系我们

中国日报网版权说明：凡注明来源为“中国日报网：XXX（署名）”，除与中国日报网签署内容授权协议的网站外，其他任何网站或单位未经允许禁止转载、使用，违者必究。如需使用，请与010-84883777联系；凡本网注明“来源：XXX（非中国日报网）”的作品，均转载自其它媒体，目的在于传播更多信息，其他媒体如需转载，请与稿件来源方联系，如产生任何问题与本网无关。

版权保护：本网登载的内容（包括文字、图片、多媒体资讯等）版权属中国日报网（中报国际文化传媒（北京）有限公司）独家所有使用。未经中国日报网事先协议授权，禁止转载使用。给中国日报网提意见：rx@chinadaily.com.cn

AI自发形成人类级认知！自动化所团队揭示多模态大模型涌现类人物体概念表征

人类能够对自然界中的物体进行概念化，这一认知能力长期以来被视为人类智能的核心。

AI自发形成人类级认知！自动化所团队揭示多模态大模型涌现类人物体概念表征

2025年中国网络文明大会

2025 RCEP区域发展媒体智库论坛

新闻奖国际传播初评公示

中国超有young