本文来自微信公众号:神经现实 (ID:neureality),作者:Anne Trafton,译者:P,校对:胡夏天,编辑:M.W.,原文标题:《深度学习带来的洞见,或许是有意引导的结果》,题图来自:视觉中国

神经网络是一种以人类大脑结构为基础建模的计算系统。它构成了许多在语音识别、计算机视觉、医学影像学等方面被广泛应用的人工智能系统的基础。

在神经科学领域,研究者们经常试着用神经网络来重现大脑所执行的任务。他们希望这些模型能够提供关于大脑本身如何执行这些任务的新假设。然而,麻省理工学院(MIT)的一组研究人员认为,人们在解释这些模型时应更加谨慎。


(资料图片仅供参考)

在一项分析中,研究者们训练了11000多个神经网络来模拟网格细胞(grid cell)的功能。网格细胞是大脑导航系统中的重要组成部分。研究者们发现,这些神经网络只有在被赋予生物系统中所不存在的、非常特定的约束条件时,才会产生类似网格细胞的活动。

“这表明,为了使模型能模拟网格细胞的活动,训练这些模型的研究人员需要令其采取一些特定的、生物学意义上不可行的实现方式。”MIT的前高级研究助理瑞兰·谢弗尔(Rylan Schaeffer)说。

MIT的这一研究团队发现,如果没有这些约束条件,神经网络很难产生网格细胞样(grid-cell-like)的活动。这表明,这些模型并不一定能带来对大脑如何工作的有效预测。

这篇研究的第一作者谢弗尔已经在2022年11月的神经信息处理系统大会(Conference on Neural Information Processing Systems)汇报了这一工作。他现在是斯坦福大学计算机系的一名博士生。MIT脑与认知科学系教授、麦戈文脑科学研究所成员伊拉·菲特(Ila Fiete)是这篇文章的通讯作者。MIT物理系的博士生米克尔·科纳(Mikail Khona)是另一位作者。

论文题目:No Free Lunch from Deep Learning in Neuroscience: A Case Study through Models of the Entorhinal-Hippocampal Circuit

建模网格细胞

几十年来,研究人员一直在使用神经网络来执行各种计算任务,这些神经网络由数千乃至数百万个处理单元相互连接而组成。节点与节点间有不同强度的连接。当用大量数据训练网络时,连接的强度会随网络学习执行任务而改变。

在这项研究中,研究人员关注于那些被开发来模拟大脑网格细胞功能的神经网络。这些网格细胞存在于哺乳动物大脑的内嗅皮层(entorhinal cortex)中。网格细胞与海马体(hippocampus)中的位置细胞(place cells)一起构成了一个大脑环路,这一环路帮助动物们知道它们在哪里,以及如何导航到另一个位置。

科学家已经证明,只要动物处于一个特定的位置,其对应的位置细胞就会做出反应,而且每个位置细胞可能对一个以上的位置做出应答。而网格细胞的工作方式则非常不同。比如,当动物在一个空间(如房间)中移动时,网格细胞只在动物处于布满空间的三角形栅格的某个顶点时才发放。不同的网格细胞群对应不同特征*的栅格,它们相互重叠。这使得网格细胞可以用相对较少的细胞数量来编码大量独特的位置信息。

*译者注:不同网格细胞在给定环境中的放电模式形成的网格可以有不同的方向(orientation)、相位(phase)和比例(scale)。

这样的位置编码使得大脑可以根据一个给定的起点和速度来预测自身的下一个位置。这种技术被称为路径整合(path integration)。在最近的几项研究中,研究人员已经训练了神经网络来执行这一任务。

来源:Christine Daniloff, MIT

为了训练神经网络来完成这项任务,研究人员向其输入一个起点和一个随时间变化的速度。该模型基本上模拟了动物在空间中漫游(roaming)的活动,并在其移动过程中计算出最新的位置。当模型执行这一任务时,神经网络中不同单元的活动模式可以被测量。每个单元的活动可以被表示为一种发放模式(firing pattern),类似于大脑中神经元的放电模式。

在此前的几项研究中,研究人员报告称,他们的模型能够产生活动模式与网格细胞的放电模式非常相似的单元。这些研究得出的结论是,在任何为执行路径整合任务而训练的神经网络中都会自然地涌现(emerge)网格细胞样的表征。

然而,MIT的研究人员得到了非常不同的结果。在对用路径整合任务训练的11000多个神经网络的分析中,他们发现,尽管其中近90%的网络成功地学习了这一任务,但只有约10%的网络产生了可被归类为网格细胞样的活动模式。这还包括了那些只产生了单个网格细胞样单元的网络。

MIT团队表示,此前的研究更有可能产生类似网格细胞的活动,只是因为研究人员在这些模型中加入了一些约束条件。

“之前的研究讲了这样的一个故事:如果你训练网络进行路径整合,你就会得到网格细胞。我们发现的是,相反,你必须对一系列参数进行选择,然后在使用了其中一小部分参数组合后,才能得到期望的结果。这与生物学不一致。”谢弗尔说。

更基于生物学的模型

在之前研究中存在的一个约束条件是,研究人员要求模型将速度转换为一个特定的位置,并由一个对应单个位置细胞的神经网络单位报告出来。为了做到这一点,研究人员还要求每个人工位置细胞只对应一个位置,但这并不是真正的位置细胞的工作方式。研究表明,海马体中的位置细胞可以对多达20个不同的位置做出应答,而不是只有一个。

当MIT团队调整模型,使人工位置细胞更像生物学上的位置细胞时,这些模型仍然能够执行路径整合任务,但它们不再产生网格细胞样的活动。同时,如果研究人员指示模型产生不同类型的位置输出,例如在有X和Y轴的笛卡尔坐标系(而不是六边形或三角形网格)上的位置,或由相对于原点的距离和角度所表征的位置时,网格细胞样活动也会消失。

菲特说:“如果你要求这个网络做的唯一的事情是路径整合,并且你对输出单元施加了一套非常具体的、并不符合生理学的要求,那么就有可能获得(人工)网格细胞。但如果你解除了对这个读出单元的任何一个限制,那就会急剧降低网络产生(人工)网格细胞的能力。事实上,通常研究人员不会这样做,尽管这些更松的条件下产生的神经网络仍然能解决路径整合任务。”

因此,如果研究人员不是已经知道网格细胞的存在并引导模型产生它们,那么,这些人工网格细胞就很可能不会作为模型训练的自然结果而出现。研究人员称,他们的发现表明,在解释关于大脑的神经网络模型时需要更加谨慎。

DeepMind Design

“当你使用深度学习模型时,它们可以是一个强大的工具,但在解释它们时必须非常谨慎,并确定它们是否真的在进行全新的预测,甚至揭示大脑优化的东西。”菲特说。

伦敦大学学院的计算神经科学教授肯尼斯·哈里斯(Kenneth Harris)说,他希望这项新研究能促使神经科学家在通过类比神经网络和大脑来论证观点时更加谨慎。

没有参与这项研究的哈里斯说:“神经网络可以成为预测的一个有用来源。如果你想知道大脑如何解决一个计算,你可以训练一个网络来执行它,然后测试大脑是否以同样的方式工作。无论这一假设是否被证实,你总会学到一些东西。这篇论文显示,‘事后预测’(postdiction)的作用不大。神经网络有很多参数,所以让它们复现出一个现有的结果并不那么令人惊讶。

MIT的研究人员说,当使用这些模型对大脑如何工作进行预测时,重要的是在建立模型时要考虑到现实的、已知的生物学约束条件。他们现在正在研究网格细胞的模型,并希望这些模型能对大脑中的网格细胞如何工作生成更准确的预测。

“深度学习模型将给我们带来关于大脑的洞见,但这只会发生在你向模型注入了大量生物学知识之后。”科纳说,“如果你使用正确的约束条件,那么这些模型就可以给你一个类似大脑的解决方案。”

注:这项研究得到了海军研究办公室、国家科学基金会、西蒙斯基金会通过西蒙斯全球大脑合作项目,以及霍华德·休斯医学研究所通过教师学者项目的资助。米克尔·科纳得到了MathWorks科学奖学金的支持。

原文:https://news.mit.edu/2022/neural-networks-brain-function-1102

本文来自微信公众号:神经现实 (ID:neureality),作者:Anne Trafton,译者:P,校对:胡夏天,编辑:M.W.

推荐内容