人类的空间导航能力依赖于视觉系统对周围环境三维布局的精准表征。在复杂的室内场景中,由墙壁构成的边界是空间几何结构的核心,为认知地图的构建和行动的选择提供了关键参照。然而,人类大脑究竟如何将二维视网膜投影转化为导航所需的三维布局表征,其深层的心理与神经机制仍有待阐明。
近日,北京大学心理与认知科学学院、IDG麦戈文脑科学研究所李晟课题组近日在《PLOS Biology》发表题为“Three-dimensional scene boundary representations for wall orientation and distance are represented distinctly in human visual cortex”的研究论文。该研究结合7T与3T功能磁共振成像(fMRI)、脑磁图(MEG)以及基于计算机视觉的建模方法,系统揭示了人脑对场景中三维空间边界结构的表征方式,为理解人脑空间导航功能的神经基础提供了新的视角。
为突破传统研究依赖人工合成刺激的局限,研究团队开发了一套基于计算机视觉的三维重建方法,对大型自然场景7T fMRI数据集(Natural Scene Dataset, NSD)中的室内图片进行分析,量化估计了场景中的墙壁边界及观察者位姿(图1)。基于大规模7T fMRI数据的表征相似性分析,研究一发现,在控制低层视觉及高层语义特征后,人脑视觉皮层对墙壁边界的表征呈现出清晰的层级化加工模式:早期视觉区(如V1–V4)主要编码边界的相对距离,而场景选择性区域(如OPA、PPA)则更侧重于编码边界的空间朝向(图2与图3)。
图1: 室内场景三维空间边界信息重建方法示意图。
图2:场景三维边界信息的模型构建及其在人脑视觉皮层上的层级化表征。
图3:场景三维边界信息在单个被试视觉皮层上的表征分布。
为进一步验证上述发现并探究导航相关任务因素的影响,研究团队开展了进一步的fMRI实验(研究二)与MEG实验(研究三)。实验要求被试分别完成导航相关和导航无关的任务,并记录大脑信号。结果表明,当场景边界成为导航相关信息时,早期视觉皮层对边界距离与边界方向的表征均显著增强。该结果揭示了高层场景加工区(如OPA)可能通过自上而下反馈调制早期视觉皮层,增强局部深度线索的表征,促进三维空间布局信息的整合。在时间维度上,边界距离信息在刺激呈现约200毫秒内迅速出现且没有受到任务的显著影响,而边界朝向信息则在约400毫秒后逐渐形成,并依赖于任务需求(图4)。fMRI与MEG的结果一致的支持了研究一所揭示的层级结构,同时进一步表明该表征过程受到空间导航相关任务的动态调控。
图4:场景三维边界信息在时间尺度上的分离表征及任务相关的反馈调节。
此外,研究还发现视觉系统能够稳定编码观察者的俯仰角(pitch angle),但对滚转角(roll angle)不敏感(图5)。由于俯仰角在日常导航行动中的重要性(如上楼梯和下坡),这一结果提示人脑视觉系统在表征空间导航相关信息时的具身属性。
图5:人脑视觉皮层对观察者自身姿态的表征。
综上,该研究系统考察了人脑如何将瞬时的视觉输入转化为具有导航意义的三维空间表征。研究结果表明,基于边界向量的表征机制可能构成连接知觉与行为的重要桥梁,使个体能够从视觉信息中快速推断自身在环境中的位置及潜在行动路径。
本研究由北京大学心理与认知科学学院、IDG麦戈文脑科学研究所李晟课题组完成,论文第一作者吴奕忱博士现为北京大学博雅博士后,李晟研究员为论文的通讯作者。该研究得到了科技部科技创新2030-“脑科学与类脑研究”重大项目和国家自然科学基金的资助。
原文链接:https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.3003541
2026-04-03