《神经元》发表脑智卓越中心关于灵活分类决策神经环路机制的研究成果

发布时间:2021-05-06

  2021年5月5日,《Neuron》期刊在线发表了题为《基于任务结构信息的灵活感知抉择神经环路机制》的研究论文,该研究由中国科学院脑科学与智能技术卓越创新中心(神经科学研究所)、上海脑科学与类脑研究中心、神经科学国家重点实验室的徐宁龙研究组完成。该研究首次在神经环路水平揭示了基于任务结构知识实现感知类别灵活决策的大脑运算机制。  

  研究人员利用全新的神经环路光学记录和光学操控技术,结合新颖的动物行为学范式,发现来自眶额叶的反馈信息支持听皮层对于听觉分类标准的编码,这种神经环路运算符合基于任务状态推断的强化学习计算模型,可实现基于任务规则的灵活信息分类。研究人员通过对这条反馈环路的精准干预,获得了因果性证据,支持该环路运算机制的确在动物灵活分类行为中起关键作用。该研究成果对于探索基于知识的灵活认知行为的神经环路运算原理起到关键的推动作用。  

 

  在变化的环境中,生物体可以根据不同的感觉信息做出特定的行为反应。在哺乳动物中,得益于大脑新皮层的演化,这种功能得到了高度发展,动物不仅可以做出简单的刺激-反应,而且可以通过内隐学习,抽提出多变环境中的共同结构,形成内在模型,或知识。这种关于环境结构的知识可以有效的指导动物对于环境状态变化形成推断,从而产生高度适应性的智能行为。研究这种灵活抉择智能行为的神经机制是揭开大脑认知之谜的关键。

  虽然神经科学界对于包括眶额叶在内的前额叶脑区在动物行为中的神经活动作了大量研究,然而一个未被解答的关键问题是,不同脑区之间如何通过复杂的环路连结协同工作从而实现基于推断的灵活决策?

  为了对这一问题进行研究,徐宁龙研究组在头部固定的小鼠上建立了灵活感知抉择的行为范式,以便在实验条件下,对灵活决策的过程进行可控的记录和分析,并在这一行为范式中,研究其背后的神经环路运算机制。这一行为范式建立在实验室之前发展的听觉分类任务的基础上,每个回合中,小鼠会接收到一个特定频率的声音刺激,并根据频率的高低对刺激进行分类,将分类的结果通过舔左或舔右的行为作出报告,从而得到一定量的水作为奖励。为了在任务中引入行为灵活性的成分,研究人员在任务中加入了两个不同的类别分界线来确定分类规则。分界线在不同的回合中会发生变化,实现任务规则的切换。小鼠为了获取奖赏,需要根据行为结果推断当前的分类规则,并依据分类规则对同一声音刺激做出不同的分类。通过这样的行为范式的设计,研究人员巧妙的利用简单的声音频率和奖励规则变化,引导小鼠执行基于任务规则的灵活抉择行为。

  经过训练,小鼠不仅可以按照任务要求对声音刺激进行灵活选择,而且逐渐建立起了利用对于类别分界线的估计推断任务规则变化的策略。这一行为策略下,当类别分界线发生变化时,小鼠不仅可以快速地改变自己的选择,还可以利用行为结果中的不完整反馈信息对尚未经历过的声音刺激的类别作出推测。

  这一任务模拟了动物利用对于任务结构信息的了解,根据不完整信息推断环境变化,从而对同样的感觉刺激做出灵活的适应性选择的智能行为。

  由于基于推测的任务状态估计是隐含的认知变量,为了研究对这种认知变量的神经编码和环路计算,研究人员建立了一个包含任务结构和状态推测的强化学习模型,这一模型不仅可以对小鼠的行为表现进行准确模拟,还可以对隐含认知变量进行估算。

  在此基础上,研究人员利用双光子在体钙成像技术,在小鼠执行以上行为任务时,对听皮层神经元进行单细胞分辨率的群体记录。记录结果表明,听皮层神经元不仅表征了声音刺激本身,有部分神经元还直接编码了对于类别分界线的推测这一隐含认知变量。这个发现揭示了大脑中的神经元如何对主观的认知过程进行实时的编码。

  为了进一步研究跨脑区神经环路如何实现根据行为结果计算类别分界线变化,研究人员根据以往解剖学和功能学研究结果推测,自上而下的眶额叶-听皮层反馈环路可能在灵活听觉分类任务中调控了听皮层对隐含分类边界的编码。为了探究这一可能性,研究人员采用了全光学记录与操控技术,在对听皮层神经元进行双光子钙成像的同时,通过光遗传技术对同侧眶额叶-听皮层投射进行抑制。发现听皮层对于类别分界线的编码的确依赖于这一跨脑区投射的环路。

  为了进一步获得因果性证据来验证眶额叶-听皮层环路是否真正参与听觉灵活分类行为,研究人员利用化学遗传学对双侧眶额叶-听皮层投射进行抑制,发现这时小鼠灵活分类的能力显著受损,从而支持了眶额叶-听皮层投射直接参与听觉灵活分类这一智能行为,这一结果也与眶额叶通过反馈信息更新听皮层对类别分界线编码这一环路计算功能相一致。

  最后,为了进一步验证眶额叶-听皮层反馈环路是否的确执行了基于任务结构推断类别边界线的计算功能,研究人员利用双光子在体钙成像对从眶额叶投向听皮层的神经元轴突活动进行记录,发现这些轴突的确编码了更新类别边界推断所需要的反馈信息。

  综上所述,该研究系统而完整的揭示了一个明确定义的神经环路如何编码和计算基于结构知识的任务状态推测,从而介导灵活决策的智能行为。该成果对于从神经环路机制水平理解智能行为和认知功能起到了重要推动作用。

 

  (A)任务设计。小鼠被训练为通过舔左或舔右的行为,报告其对于声音频率的分类,以获得一定量的水作为奖励。任务采用的声音刺激为七个按音程均匀分布在7 kHz到28 kHz之间的纯音。在不同的段落中,声音的分界线分别位于10 kHz(低频分界)和20 kHz(高频分界)。(B)一次实验中不同类型段落里小鼠的心理物理曲线。虚线代表小鼠主观上对于声音刺激频率高低的分界线。误差代表95%的置信区间。绿色为低频分界段落中的心理物理曲线,橙色为高频分界段落中的心理物理曲线。(C)抑制眶额叶-听皮层投射影响了听觉分类的灵活性。(D)在使用双光子在体钙成像记录听皮层神经元活动的同时抑制眶额叶-听皮层投射活动。(E)听皮层中神经元对于段落类型的编码依赖于眶额叶-听皮层投射活动。(F)对于段落类型具有选择性的听皮层神经元活动表征了小鼠对于类别分界线的估计,该信息表征依赖于眶额叶-听皮层投射活动。(G)对眶额叶-听皮层轴突进行双光子在体钙成像记录。(H)眶额叶-听皮层轴突表现出对于小鼠抉择和奖赏的选择性。(I)眶额叶-听皮层轴突活动向听皮层提供了反馈信息。

  该工作由中科院脑智卓越中心感知的神经基础研究组的博士研究生刘彦和等人在徐宁龙研究员的指导下完成,实验室成员辛宇、崔乐乐、潘璟玮等做出了重要贡献。研究过程中得到脑智卓越中心杨天明研究员的大力支持。该研究得到国家自然科学基金委、科技部、中国科学院和上海市科委的资助。 

 

 

   

 

附件下载: