对可再生的模型的序列学习:复制和分析模块化飙升奖励网络基础的学习gydF4y2Ba
- 1gydF4y2Ba神经科学和医学研究所(INM-6)和高级模拟研究所(IAS-6)和JARA-BRAIN研究所,德国j。j研究中心gydF4y2Ba
- 2gydF4y2Ba计算机科学3软件工程系,亚琛工业大学,德国亚琛gydF4y2Ba
- 3gydF4y2BaDonders大脑研究所认知和行为,奈梅亨,荷兰内梅亨大学gydF4y2Ba
从世界获取统计规律,大脑必须可靠地过程中,和学习,时空的结构化信息。尽管越来越多的计算模型试图解释这种序列学习可以实现神经硬件,许多人仍然有限的功能或生物物理缺乏合理性。如果我们要在这些模型中收获知识和到达更深的机械理解皮质电路顺序处理的关键是模型和他们的发现是可访问的,可再生的,定量可比性。这里我们说明这些方面的重要性,通过提供一个彻底的调查最近提议的序列学习模型。我们重新实现模块化的柱状架构和奖励学习规则的开源巢模拟器,并成功地复制原始研究的主要发现。在这些基础上,我们进行深入分析模型的鲁棒性参数设置和基本假设,突出其优势和弱点。我们将演示一个限制模型的组成序列顺序连接的硬连接的模式,并提出可能的解决方案。最后,我们表明,模型的核心功能是保留下更多biologically-plausible约束。gydF4y2Ba
1。介绍gydF4y2Ba
在动态环境中导航需要精确的协调行动和决定在时间和空间中,匹配的时空结构的刺激他们的基础。因此,学习能力、处理和预测认知的序列模式是一个关键组成部分,与最新实验结果显示大量的大脑区域参与序列处理(gydF4y2BaDehaene et al ., 2015gydF4y2Ba;gydF4y2Ba威尔逊et al ., 2018gydF4y2Ba;gydF4y2Ba海宁et al ., 2021gydF4y2Ba)。一些地区,如海马,专业(空间)的任务主要依靠在序列和顺序的信息gydF4y2Ba压缩gydF4y2Ba时间特性,例如由回忆序列比经验(gydF4y2Ba1999年8月和征税gydF4y2Ba)。其他地区,包括早期的感官等领域初级视觉皮层,不仅能够学习和回忆的一系列刺激模式,而且单个元素的持续时间(gydF4y2Ba徐et al ., 2012gydF4y2Ba;gydF4y2BaGavornik和贝尔,2014年gydF4y2Ba)。事实上,能够代表一个序列的顺序和时间组件有两个最基本的要求,任何系统处理顺序的信息。gydF4y2Ba
然而,大多数现有的模型生物序列无监督学习的地址只有第一个这两个标准,专注于获取元素的顺序,通常没有考虑他们的持续时间。他们要么不能本质上代表了时间间隔(gydF4y2Ba绝et al ., 2018gydF4y2Ba;gydF4y2BaBouhadjar et al ., 2021gydF4y2Ba),或者他们认为固定和相同的持续时间为每个元素是有限的架构(gydF4y2Ba梅斯et al ., 2021gydF4y2Ba),或者他们甚至产生时间序列,产生自发地在缺乏结构化输入(因此不相关,gydF4y2BaFiete et al ., 2010gydF4y2Ba)。其他研究已经表明,事件和刺激的持续时间可以通过瞬变轨迹的神经编码空间通过不同的细胞组件的顺序激活,但这些机制要么是限制时间(gydF4y2BaDuarte和莫里森,2014gydF4y2Ba;gydF4y2BaDuarte et al ., 2018gydF4y2Ba的上下文中),探讨工作记忆(gydF4y2BaMongillo et al ., 2008gydF4y2Ba;gydF4y2Ba菲茨et al ., 2020gydF4y2Ba)或依靠大量工程网络架构(gydF4y2BaKlampfl马斯河,2013gydF4y2Ba)。gydF4y2Ba
寻求统一这些计算功能,gydF4y2Ba锥和Shouval (2021)gydF4y2Ba最近提出了一个新颖的生物物理现实的飙升网络模型,避免了时间压缩的问题,同时保持在序列重复元素的准确顺序。依赖于层压结构,以及实验观察细胞属性,系统使用本地,eligibility-based可塑性规则(肠胃病用药学习规则看,例如,gydF4y2BaPorr Worgotter, 2007gydF4y2Ba;gydF4y2BaFremaux et al ., 2015gydF4y2Ba;gydF4y2Ba郭士纳et al ., 2018gydF4y2Ba;gydF4y2Ba麦基和Grienberger, 2020gydF4y2Ba)学习元素的顺序绘制出stimulus-tuned列(类似于之间的物理路径gydF4y2BaZajzon et al ., 2019gydF4y2Ba),每个项目的持续时间内被编码在复发性激活相应的列。学习规则,基于两个资格痕迹和之间的竞争在全球范围内提供奖励的信号,基于最近的实验结果(gydF4y2Ba他et al ., 2015年gydF4y2Ba;gydF4y2Ba韦尔塔et al ., 2016gydF4y2Ba)。这种模块化的体系结构允许网络灵活学习和回忆与可变长度8个元素的序列,但只有简单的物品之间的转换(一阶马尔可夫过程的)。更复杂的序列与历史依赖(即。,higher-order Markovian) can be learned, but require additional structures for memory. Given the increased complexity, this ability is only demonstrated in a continuous rate-based model.
的代码模型中可用gydF4y2BaMATLABgydF4y2Ba。由于这是一个专有的,闭源软件,模型表达了这种方式的可访问性问题(不是每一个科学家都能承受一个许可证)和承担更大的风险成为可执行的遗留代码,如果不定期维护的代码(例如,见gydF4y2BaBrinke et al ., 2022gydF4y2Ba)。此外,作为gydF4y2BaMATLABgydF4y2Ba是一个通用数值计算平台,研究人员必须开发所有神经科学模型和仿真算法gydF4y2Ba新创gydF4y2Ba,它提供了一个更高的风险实现错误和不太合适数值(gydF4y2Ba泡利et al ., 2018gydF4y2Ba)。gydF4y2Ba
因此在本文中,我们提出一个复制的原始研究中,服务的双重目的测试最初的发现和提供一个更容易版本的模型来计算神经科学社区。具体来说,我们使用开源软件重新实现他们的模型gydF4y2Ba巢gydF4y2Ba(gydF4y2BaGewaltig Diesmann, 2007gydF4y2BaPython)来模拟网络和数据分析,从而确保一个可重用和可维护的代码库。gydF4y2Ba
在这里,我们使用术语gydF4y2Ba复制gydF4y2Ba在gydF4y2BaRgydF4y2Ba5gydF4y2Ba所描述的感觉gydF4y2BaBenureau和鲁吉尔(2018)gydF4y2Ba,即,striving to obtain the same results using an independent code base, whereas a繁殖gydF4y2Ba(gydF4y2BaRgydF4y2Ba3gydF4y2Ba)的模型取得了如果我们获得了原始研究的结果使用原始代码。然而,其他人认为应该使用这些术语反过来:明白了gydF4y2Ba叩诊槌(2018)gydF4y2Ba概述和分析。gydF4y2Ba
我们成功地重新复制的主要结果箝制网络模型从最初的出版物。超越报道发现,我们执行一个广泛的网络和学习参数的灵敏度分析,并识别关键组件和模型的假设。我们测试模型在多尺度和推断的基本关系的规模和数值不同的参数。此外,我们表明,原有的模式和实施依赖于设定前馈预测成功学习的顺序列元素之间在一个给定的序列。我们讨论为什么学习失败时推广到更合理的结构,在这种结构中,允许所有列之间的预测,并提供了两种可能的解决方案,恢复系统的功能。最后,我们证明的核心学习机制可以保留在功能上等价的网络体系结构,它只包含本地抑制电路,与皮层连接模式(gydF4y2Ba布朗和Hestrin, 2009年gydF4y2Ba)。gydF4y2Ba
我们面临的挑战在复制本研究强调详细和准确的文档的重要性,以及访问模型代码。事实上,一个成功的复制的主要结果不可能一直没有能够参考原始实现。除了多个模型描述和代码之间的差异,一些概念的局限性我们揭示来自某些关键实现细节(如中讨论gydF4y2Ba泡利et al ., 2018gydF4y2Ba)。gydF4y2Ba
因此我们的研究结果表明,这样的事业复制研究还可以提高整体服务质量和严谨的科学工作。此外,如果执行原出版后不久,这样的深入分析可以导致更好的理解计算模型,从而进一步提高的可能性模型将基于它,,减少的可能性,这些模型包含不正确的实现或隐式(但关键)的假设。gydF4y2Ba
2。结果gydF4y2Ba
探讨如何通过时间序列变量时间皮质电路,gydF4y2Ba锥和Shouval (2021)gydF4y2Ba提出一个连锁的模块化体系结构,其中每个人口(模块)调到一个特定的元素序列,和学习翻译内突触权重的修改和模块之间基于奖励的信号。我们重新实现模型,最初在gydF4y2BaMATLABgydF4y2Ba使用开源软件gydF4y2Ba巢gydF4y2Ba。获取原始代码,我们重新实现版本,请看下面的数据可用性语句。gydF4y2Ba
模型示意图所示gydF4y2Ba图1一个gydF4y2Ba。培训期间后的模块是按照特定顺序刺激多个试验,网络应该能够召回/回放的完整序列从单一线索。如果学习是成功的,元素的顺序和时间都可以忠实地回忆道。gydF4y2Ba
图1gydF4y2Ba。序列学习任务和网络体系结构。gydF4y2Ba(一)gydF4y2Ba三个间隔的序列(元素)是由一个网络学习尽可能多的专门的人群(列)。个体数量顺序刺激,全球奖励信号在每个元素的开始和结束。培训后,复发和前馈权重加强,序列成功后提示回忆道。丰满的右边的彩色部分说明了活动的持续时间(发射率)超过一定阈值。gydF4y2Ba(B)gydF4y2Ba每个stimulus-specific列是由两个兴奋性,gydF4y2Ba计时器gydF4y2Ba(gydF4y2BaTgydF4y2Ba),gydF4y2Ba使者gydF4y2Ba(gydF4y2Ba米gydF4y2Ba),和两个相应的抑制人口,gydF4y2Ba我gydF4y2BaTgydF4y2Ba和gydF4y2Ba我gydF4y2Ba米gydF4y2Ba。固体(虚线)箭头表示静态(塑料)连接固定。Cross-columnar抑制兴奋人口在相应的总目标层(gydF4y2BalgydF4y2Ba5gydF4y2Ba或gydF4y2BalgydF4y2Ba2/3gydF4y2Ba)。gydF4y2Ba(C)gydF4y2Ba兴奋的人群的发射率在学习(前三块)和召回(情节)四个时间间隔(500;1000;700;和1800 ms)。光颜色代表(黑暗)gydF4y2BaTgydF4y2Ba(gydF4y2Ba米gydF4y2Ba)细胞。冲浅蓝色曲线上面板插图显示了抑制人口gydF4y2Ba我gydF4y2BaTgydF4y2Ba在gydF4y2BalgydF4y2Ba5gydF4y2Ba。绿色(灰色)垂直栏显示25 ms奖励(跟踪耐火材料),25毫秒后刺激抵消(见插图)。gydF4y2Ba(D)gydF4y2Ba强化活动的兴奋性细胞(上)和相应的ISI分布(底部),在回忆,网络gydF4y2Ba(C)gydF4y2Ba。在光栅图,神经元是按人口(gydF4y2BaTgydF4y2Ba,gydF4y2Ba米gydF4y2Ba)和顺序列(见右边的颜色编码)。gydF4y2Ba
最初,每个模块展品只有短暂的活动在回应一个短暂的刺激(50毫秒,见第四节),连接相对较弱。每个序列元素的持续时间由一个全局可用奖励信号标志,形成中央组件的地方强化学习规则基于两个竞争,Hebbian-modulated资格(痕迹gydF4y2Ba韦尔塔et al ., 2016gydF4y2Ba)。这synapse-specific规则是用于更新权重复发和前馈连接,负责的持续时间和过渡元素之间,分别。学习之后,这些权重是不同的加强,这样在线索回忆经常性活动编码当前元素的程度,而前馈预测刺激与下一个序列元素相关联的模块。gydF4y2Ba
模块大致对应于一个简化的柱状结构映射到L2/3和L5皮层。列是由两个兴奋的人群,gydF4y2Ba计时器gydF4y2Ba(gydF4y2BaTgydF4y2Ba),gydF4y2Ba信使gydF4y2Ba(gydF4y2Ba米gydF4y2Ba),和两个抑制人口有关gydF4y2Ba我gydF4y2BaTgydF4y2Ba和gydF4y2Ba我gydF4y2Ba米gydF4y2Ba(gydF4y2Ba图1 bgydF4y2Ba),每个片段包含100生活神经元和conductance-based饱和突触(见第4节)。计时器细胞学会代表通过塑料复发关系期间,当信使细胞学习过渡到列与下一个序列元素相关联。注意,除非特别提到,前馈预测连续列对应于项目之间只存在在输入序列。换句话说,序列转换身体追踪从发病,只有权重学习(参见第3节)。Cross-inhibition列之间产生一个软赢家通吃(WTA)行为,确保只有一个列占主导地位的活动。gydF4y2Ba
2.1。序列学习和回忆gydF4y2Ba
这种模块化的架构允许系统强劲学习和回忆输入序列与变量时间跨度。gydF4y2Ba图1 cgydF4y2Ba描述了人口反应前后的网络学习四个时间间隔,500;1000;700;和1800 ms(参见图3gydF4y2Ba锥和Shouval, 2021gydF4y2Ba)。起初,一列产生短暂的刺激反应,刺激定时器和初始瞬变gydF4y2BalgydF4y2Ba5gydF4y2Ba抑制细胞gydF4y2Ba我gydF4y2BaTgydF4y2Ba(见gydF4y2Ba图1 cgydF4y2Ba、上面板和插图)。与抑制燃烧速度衰减速度比计时器的由于高阈值和缺乏复发(见第4节),有一个短窗口当定时器的净激发细胞信使细胞引起更强的反应。gydF4y2Ba
培训期间,当每一列刺激顺序,反复计时器预测得到加强,他们的反应信号扩展到相应的奖励(绿色竖线)。同时,信使细胞的前馈预测到下一列也增强,这样在回忆第一列(刺激),它们足以引发强烈反应细胞在相应的定时器。这种连锁反应使一个完整的原始序列的重放,保持秩序和间隔。在回忆中说明了活动的传播gydF4y2Ba图1 dgydF4y2Ba(参见图3 s4gydF4y2Ba锥和Shouval, 2021gydF4y2Ba)。网络显示现实飙升统计(变异系数1.35和0.95的计时器和信使细胞),信使细胞有较低的发射率比计时器细胞,大致符合实验观测值(gydF4y2Ba刘et al ., 2015gydF4y2Ba)。gydF4y2Ba
2.2。学习和回忆精度gydF4y2Ba
模型展示学习过程和回忆的准确性的波动序列由于噪音和强化网络的随机性质。中间长度的序列,召回时间通常在±10 - 15%的目标不同持续时间(见gydF4y2Ba图2一个gydF4y2Ba(左)。然而,这个范围取决于几个参数,通常随时间或序列长度(见gydF4y2Ba补充图1gydF4y2Ba)。然而,平均在多个网络实例,这些影响减毒和学习变得更精确(gydF4y2Ba图2一个gydF4y2Ba,对吧)。gydF4y2Ba
图2gydF4y2Ba。回忆的准确性与进化的学习。结果显示四个序列间隔700毫秒。gydF4y2Ba(一)gydF4y2Ba学习和波动序列回忆。我们定义gydF4y2Ba回忆的时间gydF4y2Ba随着时间的计时器人口低于10 spks /秒。左:召回时间30试验学习后,对一个网络的实例。右:分布的平均召回10次网络实例,与中值在每个网络计算30多个重复试验。gydF4y2Ba(B)gydF4y2Ba意思是突触权重前馈(信使计时器在随后的列,顶部)和复发性(计时器,计时器在同一列,底部)连接一个网络实例。gydF4y2Ba(C)gydF4y2Ba复发性意味着LTP和有限公司痕迹(顶部)和前馈(底部)连接,学习试验T = 3, T = 15, T = 35和一个网络实例。gydF4y2Ba
这些波动也可以观察到突触权重。而复发性权重在计时器种群收敛于一个相对稳定的值大约70试验(见gydF4y2Ba图2 bgydF4y2Ba图3、底板和s2gydF4y2Ba锥和Shouval, 2021gydF4y2Ba),前馈重量显示更大的可变性在训练(上面板)。复发性连接,收敛到一个固定的点学习可以正式证明(见证据gydF4y2Ba锥和Shouval, 2021gydF4y2Ba)。作为Hebbian学习规则(见第4节),这两个相互竞争的LTP和有限公司资格痕迹被激活在复发性活动计时器。假设两个痕迹很快饱和,稍微更高的峰值,并给予更大时间常数的LTP跟踪,公司跟踪将很快衰减,导致复发的便利化突触奖励期间(gydF4y2Ba图2 cgydF4y2Ba上面板)。学习收敛当净区别两个痕迹是零回报的时候。gydF4y2Ba
前馈权重,更难获得解析解。由于Hebbian co-activation信使细胞和定时器的后续模块,痕迹被激活(非零)前不久奖励期间,暂时重置后奖励,和重新激活下一个试验(gydF4y2Ba图2 cgydF4y2Ba,下半部分)。净重改变因此跟踪分歧两个的和随后的奖励。学习经验,然而往往收敛到一些相对稳定的价值如果前馈预测编码列之间只存在后续的输入元素。然而,由于全球奖励信号可以在每个突触,所有从信使人口预测其他模块,在理论上,是方便,只要有一些时间co-activation。我们在2.5节详细说明这方面。gydF4y2Ba
2.3。模型的鲁棒性gydF4y2Ba
虽然正式学习只能保证收敛的复发计时器连接,gydF4y2Ba锥和Shouval (2021)gydF4y2Ba报告说,在实践中一些连接的模型表现强劲变化和学习参数。然而,参数值和序列长度的范围进行了分析gydF4y2Ba锥和Shouval (2021)gydF4y2Ba(见图5和补品)并没有给出一个完整的账户参数的影响和模型的局限性。更彻底地测试模型的鲁棒性,我们不同的突触权重和学习参数超出了那些被认为在最初的工作中,和测量的一致性在召回时期四个700毫秒间隔组成的序列。gydF4y2Ba
首先,我们不同的兴奋和抑制性投影信使细胞在一个专栏中,在一个时间间隔的±20%的基线值。这是探索范围gydF4y2Ba锥和Shouval (2021)gydF4y2Ba(见图5),但只有定性结果的人口活动报道,只有所有可能的组合的一个子集。在基线网络,平均17±50召回时间报道了140 ms(或20%正确的区间)当测量相对于他们的预期开始时间,而这些值15到22之间不同的测试参数配置(见gydF4y2Ba图3一gydF4y2Ba左上角)。平均在所有四列,离群值下降到11和15(之间的范围gydF4y2Ba图3一gydF4y2Ba左下角)。接下来,我们使用一个修改z分数基于平均绝对偏差(gydF4y2BaIglewicz Hoaglin, 1993gydF4y2Ba)评估的分布绝对回忆*(不是相对于预期出现)。这些都是集中在平均召回时间密切在每一列中,异常值减少的数量显著低于1.5(3%的召回试验,gydF4y2Ba图3一gydF4y2Ba,对吧)。这些结果表明,召回时间相对一致的每一列(勉强分布),但绝对偏离预期值增加序列中的元素的位置。gydF4y2Ba
图3gydF4y2Ba。鲁棒性突触权重的变化和学习参数。系统训练四个元素的序列,每700毫秒的时间。定时器的细胞,我们定义gydF4y2Ba相对召回时间gydF4y2Ba召回时间相对于刺激发病,即。,时间从预期的起始时间(0;7,00;1400;序列中的2100)的速率低于一个阈值10 spks /秒。相反,gydF4y2Ba绝对记得时间gydF4y2Ba只是当利率低于阈值(相对于0)。gydF4y2Ba(一)gydF4y2Ba数量的异常值间隔50召回过程中试验报告,作为两个突触权重的变化百分比的函数在一个专栏:兴奋性计时器信使,抑制gydF4y2Ba我gydF4y2BaTgydF4y2Ba信使。上面一行显示了数量的异常值,定义为±140 ms的偏差修正区间相对于预期发病(左),和异常值检测的数量使用修改后的z分数(阈值> 3,对面板)基于列的平均绝对偏差gydF4y2BaCgydF4y2Ba4gydF4y2Ba(见正文)。底下一行显示了各自的异常值平均四列。gydF4y2Ba(B)gydF4y2Ba偏差的平均召回时间预计700 ms,兴奋和抑制性突触权重的函数在信使细胞列(左),和作为一个功能的cross-columnar (gydF4y2BaCgydF4y2Ba我gydF4y2Ba≠gydF4y2BaCgydF4y2BajgydF4y2Ba)抑制性突触权重(右)在同一层。在顶部和底部行gydF4y2Ba(一)gydF4y2Ba。所有的数据在gydF4y2Ba(A, B)gydF4y2Ba是平均20多个网络的实例。gydF4y2Ba(C)gydF4y2Ba研制出序列的平均召回时间700毫秒间隔,50岁以上的单一网络的回忆试验实例。左:基线网络。试验中心:在每个培训,学习参数(见正文)是随机和独立于分布在±20%的基线值。误差线代表标准偏差。右:学习参数集随机画一旦为每个网络实例,数据显示平均超过10的实例。gydF4y2Ba
换句话说,错误和变化积累与序列长度,网络是特别敏感的弱兴奋性连接计时器上(见Δ信使细胞gydF4y2BawgydF4y2Ba=−20%gydF4y2BaTgydF4y2Ba→gydF4y2Ba米gydF4y2Ba)。事实上,这些错误出现在回忆越来越短的间隔(gydF4y2Ba图3 bgydF4y2Ba(左),最后一列报告平均接近600 ms,而不是700 ms。所有列,平均中位数召回时间是更准确的。类似的结果获得了抑制的变化预测之间的列(gydF4y2Ba图3 bgydF4y2Ba,对吧)。gydF4y2Ba
模型显示类似的健壮性合格跟踪变化的时间常数τgydF4y2BapgydF4y2Ba,τgydF4y2BadgydF4y2Ba,gydF4y2Ba,gydF4y2Ba)和变量缩放Hebbian贡献跟踪动态(ηgydF4y2BapgydF4y2Ba,ηgydF4y2BadgydF4y2Ba,gydF4y2Ba,gydF4y2Ba,见第4节)。然而,在原来的工作分析是两个元素的序列的每个(参见图5-Supplement 1 500 msgydF4y2Ba锥和Shouval, 2021gydF4y2Ba),这里我们使用一个序列的四个700 ms的元素。相对于基线网络(gydF4y2Ba图3 cgydF4y2Ba(左),平均召回时间衰减与序列长度仅略,随机化的学习参数在每个学习试验不仅增加了平均召回时间所有列,但它也会导致更大的可变性的重播序列(gydF4y2Ba图3 cgydF4y2Ba中心)。随机化的学习参数一旦每个网络实例,平均而言,导致结果更接近基线情况,但进一步增加召回可变性在最后一列(gydF4y2Ba图3 cgydF4y2Ba分析不执行gydF4y2Ba锥和Shouval, 2021gydF4y2Ba)。gydF4y2Ba
这些结果说明该系统处理和中间基线参数扰动对信使的传入权重人口,cross-columnar抑制和学习规则变量。gydF4y2Ba
而计时器和信使细胞是负责维护一个序列元素活动和信号后续的发生,抑制人口的动态协调各个组件的时机。例如,通过他们的活动曲线特征,抑制细胞gydF4y2BalgydF4y2Ba5gydF4y2Ba同时控制细胞信使的活动在自己的列和定时器的发病数量在下一篇专栏文章中。通过修改突触权重从计时器细胞抑制人口的列(gydF4y2BawgydF4y2BaTgydF4y2Ba→gydF4y2Ba我gydF4y2BaTgydF4y2Ba),因此控制直接激励,我们试图理解这些抑制性细胞如何影响学习。gydF4y2Ba
值明显低于基线(<−25%,灰色区域gydF4y2Ba图4一gydF4y2Ba),网络无法召回序列以可靠的方式(gydF4y2Ba图4 bgydF4y2Ba),在特定的序列包含两个以上的元素。此外,召回时间变化明显在列的情况下减少重量。随着重量的增加,净激发导致更持久的抑制越强gydF4y2Ba我gydF4y2BalgydF4y2Ba5gydF4y2Ba,延迟激活的信使细胞(gydF4y2Ba图4 cgydF4y2Ba)。这导致一个高估的元素与元素的持续时间,增加在序列中的位置(+Δ200 msgydF4y2BawgydF4y2BaTgydF4y2Ba→gydF4y2Ba我gydF4y2BaTgydF4y2Ba= 40%,gydF4y2Ba图4 dgydF4y2Ba)。gydF4y2Ba
图4gydF4y2Ba。的活动gydF4y2BalgydF4y2Ba5gydF4y2Ba抑制人口的准确的学习是至关重要的。gydF4y2Ba(一)gydF4y2Ba偏差的平均召回三间隔700毫秒的时间,作为突触权重变化的函数gydF4y2BaTgydF4y2Ba→gydF4y2Ba我gydF4y2BaTgydF4y2Ba相对于基线(ΔgydF4y2BawgydF4y2Ba= 0),灰色区域(<−25%)标志着地区学习是不稳定的(不是所有的元素都可以强劲)回忆道。数据通过网络平均五个实例。gydF4y2Ba(罪犯)gydF4y2Ba特征值偏差的发射率在召回−25日0,40%相对于基线。坚实的曲线代表兴奋的人群如gydF4y2Ba图1gydF4y2Ba,而虚线显示相应的抑制人口gydF4y2Ba我gydF4y2BaTgydF4y2Ba在为C_i。gydF4y2Ba
虽然这些观察结果表明一个健壮的学习机制,也表明一个内在一致的模型的偏差报告间隔越来越短和更大的可变性在回忆的时候时间序列。gydF4y2Ba
2.4。模型的扩展gydF4y2Ba
在前面的部分中,我们调查的敏感性模型突触权重的选择,但一个更广泛的鲁棒性的定义还包括不变性的大小不同的人群。理想情况下,模型应该保持其动力和学习属性也较大的网络,而不需要手动校准系统的参数。在平衡的随机网络,增加了网络规模的一个因素gydF4y2Ba米gydF4y2Ba和减少突触权重的一个因素gydF4y2Ba应保持活动特征(gydF4y2Ba范Vreeswijk Sompolinsky, 1998gydF4y2Ba;gydF4y2BaLitwin-Kumar Doiron, 2012gydF4y2Ba;gydF4y2Ba范Albada et al ., 2015gydF4y2Ba)。模型研究这些系统有很大区别与特性,比如兴奋和抑制的比例(1:1,而不是4:1),或强周期性连接在小gydF4y2BaNgydF4y2Ba政权,导致显著的波动受噪音。此外,典型的激活模式基本序列学习和回放是更复杂的。这些因素表明,成功连接的扩展可能需要额外的修改。gydF4y2Ba
在模型的原始配方,每个人口(信使,计时器,抑制)包含100个神经元。研究模型的尺度gydF4y2BaNgydF4y2Ba′= 400,我们保持所有参数不变,所有无塑性的权重gydF4y2Ba(见gydF4y2Ba补充表4gydF4y2Ba)。在这样的标准扩展,系统无法学习和回忆序列(gydF4y2Ba图5一个gydF4y2Ba),主要是由于高发射率gydF4y2Ba我gydF4y2BaTgydF4y2Ba细胞。这些衰减慢于相应的定时器细胞,抑制计时器人口在随后的列,因此禁止一个正确的顺序激活在训练。gydF4y2Ba
图5gydF4y2Ba。缩放参数的模型需要手动重调。gydF4y2Ba(一)gydF4y2Ba特征发射率在训练(上)和回忆(底部)组成的一个序列三个间隔700毫秒,在大型网络中,其中每个人口组成的gydF4y2BaNgydF4y2Ba′= 400个细胞。所有静态权重按比例缩小了gydF4y2Ba(见方法)。坚实的曲线显示计时器(光)和信使(黑暗)细胞,冲曲线gydF4y2Ba我gydF4y2BaTgydF4y2Ba细胞。gydF4y2Ba(B)gydF4y2Ba就像在gydF4y2Ba(一)gydF4y2Ba,进一步手动调整特定的权重。,第四节gydF4y2Ba补充材料gydF4y2Ba。gydF4y2Ba
然而,可以找到一组参数(参见第4部分gydF4y2Ba补充表4gydF4y2Ba)学习按预期展开;这是说明gydF4y2Ba图5 bgydF4y2Ba。这里的关键组件是活动的gydF4y2Ba我gydF4y2BaTgydF4y2Ba(见也gydF4y2Ba图4gydF4y2Ba)。这必须满足三个条件:第一,它必须衰变率略高于计时器人口在同一列;第二,它必须足够抑制计时器数量在所有其他列,使WTA动力学;第三,WTA抑制计时器数量必须足够弱,他们仍然可以在刺激被激活。实现这一目标的一个方法是通过进一步减少当地的权重gydF4y2BawgydF4y2BaTgydF4y2Ba→gydF4y2Ba我gydF4y2BaTgydF4y2Ba在一列和cross-columnar抑制gydF4y2Ba。这表明,正确的参数,动态底层网络的学习过程是独立的大小。虽然这项工作的范围之外,可能扩展可以实现更大范围的模型尺寸,只要上述核心属性保留。gydF4y2Ba
2.5。预测之间的所有列gydF4y2Ba
在原始的实现gydF4y2Ba锥和Shouval (2021)gydF4y2Ba,在论文中描述相比,兴奋性预测列之间只被允许在一个前馈方式,因此硬连接的顺序序列元素。因为这样一个预先确定的和stimulus-dependent连接模式削弱了模型的生物合理性的要求,我们对模型的学习能力在这个约束放松。gydF4y2Ba
为此,我们延长了基线与额外的预测从信使细胞网络专栏gydF4y2BaCgydF4y2Ba我gydF4y2Ba计时器细胞在所有其他列gydF4y2BaCgydF4y2BajgydF4y2Ba,(gydF4y2Ba我gydF4y2Ba≠gydF4y2BajgydF4y2Ba中所描绘的一样)gydF4y2Ba图6gydF4y2Ba。这些预测的权值初始化接近0,没有必要进一步措施保持相同的活动水平基线网络。尽管最初学习开始之前,活动很快就失去了它的典型的时间结构和学习过程损坏(gydF4y2Ba图6 bgydF4y2Ba)。只有几十个试验后,不匹配的激活顺序列刺激,与多个种群同时响应。人口这样随机的,竞争激烈的反应也贯穿召回试验。gydF4y2Ba
图6gydF4y2Ba。所有cross-columnar激发禁止学习。gydF4y2Ba(一)gydF4y2Ba扩展原始架构中描述gydF4y2Ba图1 bgydF4y2Ba,gydF4y2Ba米gydF4y2Ba→gydF4y2BaTgydF4y2Ba所有列之间存在的联系gydF4y2BaCgydF4y2Ba我gydF4y2Ba→gydF4y2BaCgydF4y2BajgydF4y2Ba(gydF4y2Ba我gydF4y2Ba≠gydF4y2BajgydF4y2Ba),并受到相同的可塑性。gydF4y2Ba(B)gydF4y2Ba兴奋的人群在学习和回忆的发射率四个时间间隔(每700毫秒)。起初,学习发展gydF4y2Ba图1 cgydF4y2Ba,但活动变得退化和序列不能正确回忆(较低的面板)。gydF4y2Ba(C)gydF4y2Ba进化cross-columnar(从gydF4y2BaCgydF4y2Ba2gydF4y2Ba、上面板)和复发计时器突触权重(下半部分)。过渡到下一个序列不能独特编码的所有列的权重加强。gydF4y2Ba(D)gydF4y2Ba序列回忆100年之后训练试验网络背景噪声较低(50%的基线值,1/2σgydF4y2BaξgydF4y2Ba)。gydF4y2Ba(E)gydF4y2Ba序列回忆100年之后在网络训练试验cross-columnar预测Hebbian激活阈值更高gydF4y2Ba(而不是基线20 spks /秒)。gydF4y2Ba
这种行为是因为预测从信使细胞到所有列都错误地加强,后续之间不仅反映了输入序列的顺序。gydF4y2Ba图6 cgydF4y2Ba说明了这样一个例子,从信使细胞突触权重gydF4y2BaCgydF4y2Ba2gydF4y2Ba所有其他列gydF4y2BaCgydF4y2BajgydF4y2Ba同样被加强,而不是只gydF4y2BaCgydF4y2Ba3gydF4y2Ba。自然,这种效应是不利的,因为信使细胞可以激活多个定时器的人群,网络中引入特性转化,废除了独特的顺序激活所需的准确的学习和回忆。换句话说,物理路径编码之间的转换序列元素不能唯一地追踪在基线网络。gydF4y2Ba
根据Hebbian-based可塑性规则(见第4节),突触权重修改奖励期间只有co-activation的预处理和突触后神经元。这意味着连接gydF4y2Ba米gydF4y2Ba细胞在一列gydF4y2BaCgydF4y2Ba我gydF4y2Ba来gydF4y2BaTgydF4y2Ba细胞在任何gydF4y2BaCgydF4y2BajgydF4y2Ba可能加强了如果有时间co-activation两个种群。虽然这是预期的行为随后列gydF4y2BaCgydF4y2Ba我gydF4y2Ba和gydF4y2BaCgydF4y2Ba我gydF4y2Ba+ 1gydF4y2Ba其他列、定时器细胞也可能由于背景噪声,从而提高相应的连接。显然,天生的(基线)网络中这不是一个问题,因为只有后续列相连。gydF4y2Ba
克服这个问题的一个简单解决方案是减少背景噪音低于阈值飙升,从而确保只有刺激人口是活跃的和不会发生“相声”通过虚假的飙升。这样做将允许网络恢复其功能属性(gydF4y2Ba图6 dgydF4y2Ba),等待一些微小的附加参数调优(见第4节)。然而,从生物合理性的观点,这缺点,神经元飙升只在他们喜欢的刺激。gydF4y2Ba
或者,可以弥补低利率自发飙升通过提高Hebbian术语的激活阈值,gydF4y2Ba(见第4节)。例如,从20到30的基线值增加spks /秒足以确保只有刺激人口达到这些利率。因此,只有刺激人口之间的突触修改,学习过程不受影响(gydF4y2Ba图6 egydF4y2Ba)。阈值的作用和合理性是第三节中详细说明。gydF4y2Ba
2.6。选择与当地抑制线路gydF4y2Ba
与皮质电路,抑制被认为是本地(gydF4y2Ba道格拉斯和马丁,2004年gydF4y2Ba;gydF4y2Ba非诺Yuste, 2011gydF4y2Ba;gydF4y2BaTremblay et al ., 2016gydF4y2Ba),描述的原始建筑gydF4y2Ba图1 bgydF4y2Ba列之间的依赖(远程)抑制预测以确保软WTA机制的存在背景活动。这方面简要讨论gydF4y2Ba锥和Shouval (2021)gydF4y2Ba,作者也提出另一种生物更为合理和功能与网络架构(见图9)。如示意图所示gydF4y2Ba图7gydF4y2Ba,可以取代了当地cross-columnar抑制抑制这些电路和相应的兴奋性投影。在基线网络相比,计时器和抑制细胞gydF4y2BalgydF4y2Ba5gydF4y2Ba刺激,这里只有计时器细胞接收输入。否则,激发到gydF4y2Ba我gydF4y2BaTgydF4y2Ba很快就会沉默计时器细胞,禁止长时间尺度所需编码输入时间。gydF4y2Ba
图7gydF4y2Ba。替代线路与当地抑制,只有兴奋cross-columnar预测。gydF4y2Ba(一)gydF4y2Ba与当地抑制功能与体系结构gydF4y2Ba图1 bgydF4y2Ba。抑制预测现在当地的列,并通过cross-columnar实现前馈抑制兴奋性预测到gydF4y2Ba我gydF4y2Ba人群。gydF4y2Ba(B)gydF4y2Ba召回两个700毫秒间隔序列组成的。插图(底板)以活动以更低的利率。和之前一样,颜色编码列。色泽代表人口gydF4y2BalgydF4y2Ba5gydF4y2Ba(光),gydF4y2BalgydF4y2Ba2/3gydF4y2Ba(黑暗),坚实的曲线表示兴奋的人群。冲(虚线)曲线代表抑制性细胞gydF4y2Ba我gydF4y2BaTgydF4y2Ba(gydF4y2Ba我gydF4y2Ba米gydF4y2Ba)。gydF4y2Ba
作为一个概念验证,我们经验导出一组参数(见gydF4y2Ba补充表5gydF4y2Ba)对于这样一个电路,发现核心网络动力学和学习过程,原则上,被保留(gydF4y2Ba图7 bgydF4y2Ba)。然而,一个重要的差异从基线行为问题的初始瞬态信使细胞在第一列中gydF4y2BaCgydF4y2Ba1gydF4y2Ba(固体,深蓝色的曲线gydF4y2Ba图7 bgydF4y2Ba,下半部分)。这是因为在信使细胞抑制gydF4y2Ba我gydF4y2Ba米gydF4y2Ba(虚线,深蓝色的曲线)(由于更高的发射阈值)的速度要比激发细胞从计时器。这导致更高的信使活动一段时间之前抑制接管和沉默。虽然这种行为从基线模型不同,它似乎并不影响学习,实际上是符合实验数据从初级视觉皮层(gydF4y2Ba刘et al ., 2015gydF4y2Ba)。gydF4y2Ba
3所示。讨论gydF4y2Ba
考虑到学习能力和召回时间序列可能是一个通用的功能构件皮质电路,最重要的是,我们明白如何实现这样的计算能力的神经基质。虽然有很多方法模型序列处理强化网络,这些要么是无法捕捉重要功能方面(例如,顺序和时间序列),或依靠生物物理结构或学习规则不切实际的假设。在这个工作我们调查了最近提出的模型gydF4y2Ba锥和Shouval (2021)gydF4y2Ba,它试图克服这些弱点。从这里我们特别关注重复性和复现性方面,我们的工作只提供了有限的原始模型的改进。因此,主要的修改,如修改学习规则或更复杂的序列学习的评价任务超出了我们的研究范围。然而,通过重新实现模型的巢模拟器,我们能够定性地复制原文的主要发现工作,找到一些关键部件和假设的模型,并强调其优势和局限性。更重要的是,我们提供一套完整的参数和模型的实现细节对一个完整的复制。计算研究越来越重要横跨多个学科,易于复制和复制成为一个越来越重要的因素,不仅允许高效的科学进步,而且以确保高质量的工作。这些观点都说明了一个明显的这项研究的结果:由于我们的发现(也可用预印本,gydF4y2BaZajzon et al ., 2023 agydF4y2Ba),原始研究的作者纠正他们的文章(gydF4y2Ba锥和Shouval, 2023gydF4y2Ba)和修改他们的代码发布,使完整的复制和正确的不一致和错误中发现他们的工作(见ModelDB更新存储库gydF4y2Ba1gydF4y2Ba),如下面列出。gydF4y2Ba
3.1。再现性gydF4y2Ba
原模型中描述gydF4y2Ba锥和Shouval (2021)gydF4y2Ba,多数参数提供gydF4y2Ba补充材料gydF4y2Ba,连同ModelDB公开的MATLAB实现。然而,尽管结果是可再生的使用提供的实现的gydF4y2BaRgydF4y2Ba3gydF4y2Ba所描述的感觉gydF4y2BaBenureau和鲁吉尔(2018)gydF4y2Ba成功的复制gydF4y2BaRgydF4y2Ba5gydF4y2Ba感觉不可能完全基于手稿中的信息gydF4y2Ba补充表gydF4y2Ba,因为许多参数并没有或完全忽略。gydF4y2Ba表1gydF4y2Ba,gydF4y2Ba2gydF4y2Ba概述的原始描述和实现之间的重要差异,分类的相关性和类型不匹配。gydF4y2Ba
表2gydF4y2Ba。获得所需参数值数值报告了类似的结果gydF4y2Ba锥和Shouval (2021)gydF4y2Ba。gydF4y2Ba
表1gydF4y2Ba列表中(或不准确陈述)关键参数,即。,those that are necessary for the model to carry out the computational tasks that are central to the original study. Such oversights are particularly problematic, as they not only make replication more challenging, but also make implicit model assumptions opaque. An illustrative example of an omitted critical parameter is the spiking threshold for the inhibitory neurons,VgydF4y2BathgydF4y2Ba,是5 mv高于兴奋性神经元的阈值。这是很重要的,因为它导致抑制率衰减略高于计时器细胞,从而激活细胞信使在适当的时间。在缺乏这种动力特性的情况下,学习失败(见例如gydF4y2Ba图5一个gydF4y2Ba)。虽然有一些实验证据飙升的这样的差别阈值,它显著的变化在不同的细胞类型和记录位置(gydF4y2BaTripathy et al ., 2015gydF4y2Ba)。同样,Hebbian学习的激活阈值,gydF4y2BargydF4y2BathgydF4y2Ba激增,是必要的,以确保自发产生的神经元噪声不会导致不必要的突触增强作用,特别是如果允许所有列(见之间的连接gydF4y2Ba图6gydF4y2Ba)。没有这样的阈值,学习仍然在基线网络收敛,但前馈的定点重量转移,稳定在一个较低的价值比基线系统(见gydF4y2Ba补充图2gydF4y2Ba)。因此,角色和最优值的阈值可能取决于网络中噪声和自发活动的数量。gydF4y2Ba
进一步的例子是合格的参数化的痕迹。而资格痕迹的时间常数决定他们的增长和衰减行为,饱和水平gydF4y2Ba能深刻地影响学习。定时器的细胞,尽管其精确值(非原创作品中提供)并不重要,数量级仍然是关键;他们必须经过精心挑选,以确保痕迹饱和刺激出现后不久,和下降阶段开始之前下一个奖励期(见也gydF4y2Ba韦尔塔et al ., 2015gydF4y2Ba)。换句话说,即使参数空间underconstrained和多个值会导致准确的学习(gydF4y2Ba韦尔塔et al ., 2016gydF4y2Ba),这些不过躺在一个受限制的间隔是很难确定的,只有相对的值在原来的工作:例如,一个值gydF4y2Ba和gydF4y2Ba复发的计时器将导致突然增加重量和学习失败。如果痕迹不饱和,学习变得更加敏感,跟踪时间常数和时间间隔的范围,可以学会使用一组参数显著收缩。此外,兴奋性突触输入较短10 ms的时间常数比其它地区的网络,这是快速定时器的初始过渡阶段所需的细胞活动。gydF4y2Ba
表2gydF4y2Ba总结了其他不那么关键参数,仍然有必要实现定性相似活动水平在原来的工作。这些包括输入相关参数(输入重量、速度),以及神经元噪声。而这些差异是由于遗漏(如噪声)或报告和使用价值之间的不匹配(例如,学习速率),其他来自工具——特性和实现。例如,对于gydF4y2BaNgydF4y2Ba= 100 MATLAB的随机数生成的结果在一个有效的连接φ= 0.3 ~ 0.26,而不是在报道gydF4y2Ba锥和Shouval (2021)gydF4y2Ba,有效不应期是3而不是2毫秒,阈值口岸注册延迟的模拟步骤。虽然这些参数影响的水平的活动网络,他们不直接影响学习过程;模型维护的关键计算功能声称。gydF4y2Ba
3.2。学习cross-columnar预测gydF4y2Ba
模型的关键属性之一是学习能力的时间序列,通过学习stimulus-specific种群之间的转换编码序列元素。然而,gydF4y2Ba锥和Shouval (2021)gydF4y2Ba状态“信使细胞只能学习连接(任何)定时器细胞外的专栏中,“我们理解作为一个断言计时器细胞信使细胞连接所有其他列。在实践中,作者的参考实现限制这些后续的列。这意味着序列的顺序是硬连接,和系统只是学习元素的持续时间。在2.5中,我们演示了基线参数学习的网络失败如果这个限制是放松和前馈预测确实允许任何列之间。gydF4y2Ba
一种简单的方式来规避这个问题是确保当前刺激神经元外人口编码保持完全(或足够)沉默,以避免Hebbian所需的co-activation突触(见gydF4y2Ba图6 dgydF4y2Ba)。尽管这样一个理想化的行为可能是一个适当的解决方案从建模的角度看,皮层神经元很少专门对特定刺激。相反,大多数细胞不规则飙升(通常以较低的利率)即使没有输入(正在进行的活动,例如,gydF4y2BaArieli et al ., 1996gydF4y2Ba),许多应对多种不同的输入(gydF4y2Ba沃克et al ., 2011gydF4y2Ba;gydF4y2BaRigotti et al ., 2013gydF4y2Ba;gydF4y2Ba德弗里斯et al ., 2020gydF4y2Ba)。gydF4y2Ba
生物学上更合理的替代方法是增加Hebbian激活阈值gydF4y2BargydF4y2BathgydF4y2Ba,这样噪音性自发活动不会导致突触强度的修改。然而,这将引入一个额外的,在模型中关键参数。此外,这样的硬阈值是耦合的强度背景活动和自发的飙升,偶尔也会有更高的利率可能不稳定的学习过程。gydF4y2Ba
3.3。功能和神经生理学方面的考虑gydF4y2Ba
从功能的角度来看,一个通用模型的序列处理应该能够执行各种相关的任务除了重复序列,如分割、学习组合序列,输入来处理不相邻的依赖关系(gydF4y2Ba惠誉和马丁斯,2014年gydF4y2Ba;gydF4y2Ba威尔逊et al ., 2018gydF4y2Ba;gydF4y2BaHupkes et al ., 2019gydF4y2Ba)。尽管如此,gydF4y2Ba锥和Shouval (2021)gydF4y2Ba讨论和提供一个基线的延伸网络高阶马尔可夫链的序列,计算模型的能力从根本上受制于一个独特的要求stimulus-column(或stimulus-population)映射。这个特性意味着对某些任务,如学习(分层)组成的序列(即。,sequences of sequences), the model size would increase prohibitively with the number of sequences, as one would require a dedicated column associated with each possible sequence combination. In addition, it would be interesting to evaluate the model's ability to recognize and distinguish statistical regularities in the input in tasks such as chunking, which involve one or more sequences interleaved with random elements.
在他们的研究中,gydF4y2Ba锥和Shouval (2021)gydF4y2Ba证明扩展率网络可以学习多,当这些先后提出了高阶马尔可夫链的序列。对于一阶马尔可夫链的序列,这也应该持有的基准飙升网络模型,取决于保留独特的stimulus-to-column映射。然而,同样重要的是要了解模型的行为当两个序列gydF4y2Ba同时gydF4y2Ba。这取决于解释和预期的行为,以及我们所知很少有实验和建模工作(但看,例如,gydF4y2Ba穆雷和葡方,2017年gydF4y2Ba)。然而,如果两个序列被认为是gydF4y2Ba独立的gydF4y2Ba我们推测,网络将无法学习和对待他们等多个原因。假设预测之间的所有列被允许(适当措施,见2.5),在强化模型之间的连接与不同的序列相关的列也会加强在颞co-activation:两个同时启动序列S1和S2, cross-columnar预测之间的列gydF4y2Ba与S1和另一个列gydF4y2Ba编码为一个元素位置gydF4y2Ba我gydF4y2Ba在S2 + 1(错误地)加强。延伸率的情况下网络的上下文表示可能混合和干涉外部热源,和颞co-activation上面所讨论的问题也有可能发生。gydF4y2Ba
此外,收敛cross-columnar突触的学习取决于两个连续奖励时间的存在。在2.2中描述和演示gydF4y2Ba图2 cgydF4y2Ba,在第一次奖励(与当前序列元素)权重疗效,即使权重已经达到了定点。然而,第二个奖励,在此期间,权重是抑郁,有必要实现零差异LTP和有限公司痕迹较低的重量值。尽管学习收敛即使没有第二个奖励,不动点会有所不同(高),因此收敛性将发生更大的权重(可能太大,稳定的发射率)。考虑到奖励(新颖)信号是在全球范围内发布之前和之后都在解释每个序列元素gydF4y2Ba锥和Shouval (2021)gydF4y2Ba奖励的存在后,最后一个元素是保证,因此这不是一个问题刺激协议中使用的原始和我们的研究。另一方面,如果我们解释奖励作为一种新奇的信号指示下一个刺激,我们不会指望它在此表格后序列的最后一个元素。在这种情况下,cross-columnar预测标志着从倒数第二过渡到最终的元素可能不是学会了准确(权重仍收敛,但可能更大比适当的值)。gydF4y2Ba
同时解决上述问题已经超出了这个工作的范围,我们推测,更细粒度的体系结构,在多个stimulus-specific可以形成不同的细胞群体组件在一个专栏中,将更符合实验证据来自大脑皮层。一些功能专业化单皮质列已经假设(gydF4y2BaMountcastle 1997gydF4y2Ba;gydF4y2Ba哈里斯和牧羊人,2015年gydF4y2Ba),但这样的列通常是由许多细胞群体对更大范围的刺激。我们假设的模型映射到这样一个长柱状结构需要一个更复杂,spatially-dependent连接以确保类似WTA动力学。完全隔离的种群的要求调到独特的刺激,然而,更难以克服,与实验数据相吻合。虽然许多细胞的调谐曲线(但不是所有的,看到的gydF4y2Ba德弗里斯et al ., 2020gydF4y2Ba感觉皮质早期)确实是强大和夏普(gydF4y2Ba休博尔和维塞尔,1959gydF4y2Ba;gydF4y2BaBitterman et al ., 2008gydF4y2Ba),这些变得弱,更广泛的皮质在以下阶段的层次结构,在细胞通常表现出混合选择性(gydF4y2BaRigotti et al ., 2013gydF4y2Ba;gydF4y2Ba副食et al ., 2016gydF4y2Ba)。因此,更复杂的任务需要的混合表示不能容易概念化的上下文中提出的网络体系结构。gydF4y2Ba
在2.6中,我们演示了模型是相对灵活的对精确布线模式,只要某些核心,inhibition-related属性保存。鉴于远程预测在大脑皮层兴奋(通常是gydF4y2Ba道格拉斯和马丁,2004年gydF4y2Ba;gydF4y2Ba布朗和Hestrin, 2009年gydF4y2Ba),原来的架构(见gydF4y2Ba图1 bgydF4y2Ba)是难以置信的由于其依赖cross-columnar抑制。的相对轻松地调整线路只有当地的抑制作用是指示性的简单但功能强大的和模块化的计算机制,表明这些可能被用作构建块在更复杂的序列学习架构。gydF4y2Ba
尽管有这些限制和对一些参数的敏感性,提出的模型gydF4y2Ba锥和Shouval (2021)gydF4y2Ba更好的理解是一个重要的一步皮质电路如何处理时间信息。而其模块化结构使空间隔离表示可能更早些时候感觉地区特点,提出基于奖励当地学习规则,部分解决信贷分配问题,是一个更普遍机制可能发生在大脑皮层。gydF4y2Ba
4所示。材料和方法gydF4y2Ba
序列学习模型分析在这项研究中详细描述的原创作品gydF4y2Ba锥和Shouval (2021)gydF4y2Ba。然而,考虑到模型描述和实现之间的许多差异(见第三节),我们目前的所有关键属性和参数是必要的对于一个成功的复制的结果,包括章节2.5和2.6的扩展体系结构研究。gydF4y2Ba
4.1。网络体系结构gydF4y2Ba
中央的特征(见网络体系结构是模块化的柱状结构gydF4y2Ba图1一个gydF4y2Ba,gydF4y2BaBgydF4y2Ba),每一个地方gydF4y2BaNgydF4y2BaCgydF4y2Ba列与一个独特的序列元素(刺激)。每一列包含两个兴奋(定时器和信使)和两个抑制人口有关gydF4y2Ba我gydF4y2BaTgydF4y2Ba和gydF4y2Ba我gydF4y2Ba米gydF4y2Ba,大致相当于gydF4y2BalgydF4y2Ba5gydF4y2Ba和gydF4y2BalgydF4y2Ba2/3gydF4y2Ba在大脑皮层。在下面,我们将参考这些细胞群gydF4y2BaTgydF4y2Ba我gydF4y2Ba,gydF4y2Ba米gydF4y2Ba我gydF4y2Ba,gydF4y2Ba,gydF4y2Ba分别上标gydF4y2Ba我gydF4y2Ba表示列gydF4y2BaCgydF4y2Ba我gydF4y2Ba。gydF4y2Ba
上述每个种群组成gydF4y2BaNgydF4y2Ba= 100漏integrate-and-fire神经元,除了网络模拟在2.4gydF4y2BaNgydF4y2Ba= 400。基线网络中使用的接线图gydF4y2Ba锥和Shouval (2021)gydF4y2Ba是示意图所示gydF4y2Ba图1 bgydF4y2Ba。在一个为C_i列,gydF4y2BaTgydF4y2Ba我gydF4y2Ba细胞连接gydF4y2Ba和gydF4y2Ba米gydF4y2Ba我gydF4y2Ba,除了反复连接到其他gydF4y2BaTgydF4y2Ba我gydF4y2Ba细胞。gydF4y2Ba米gydF4y2Ba我gydF4y2Ba神经元激发当地抑制人口gydF4y2Ba,抑制了gydF4y2Ba。抑制兴奋性细胞之间也存在列在一个分层的方式,也就是说,gydF4y2Ba和gydF4y2Ba,gydF4y2Ba我gydF4y2Ba≠gydF4y2BajgydF4y2Ba。最后,gydF4y2Ba米gydF4y2Ba我gydF4y2Ba细胞gydF4y2BaCgydF4y2Ba我gydF4y2Ba以前馈方式连接gydF4y2BaTgydF4y2Ba我gydF4y2Ba+ 1gydF4y2Ba细胞在随后的列gydF4y2BaCgydF4y2Ba我gydF4y2Ba+ 1gydF4y2Ba。不同人群之间的所有连接在同一个和φ= 0.26的密度。注意,只有前馈的预测gydF4y2Ba米gydF4y2Ba我gydF4y2Ba→gydF4y2BaTgydF4y2Ba我gydF4y2Ba+ 1gydF4y2Ba和复发性gydF4y2BaTgydF4y2Ba我gydF4y2Ba→gydF4y2BaTgydF4y2Ba我gydF4y2Ba连接受到可塑性(见下图);所有其他连接是静态的。塑料重量接近0和静态初始化权重通常分布在他们的平均值与标准差为1。gydF4y2Ba
参数的完整的体系结构提出了gydF4y2Ba锥和Shouval (2021)gydF4y2Ba以及下面描述的变量中指定gydF4y2Ba补充材料gydF4y2Ba。gydF4y2Ba
以下4.4.1。按比例缩小的模型gydF4y2Ba
2.4中描述的扩展网络模型,神经元的数量在每个人口增加gydF4y2BaNgydF4y2Ba′= 400gydF4y2BaNgydF4y2Ba= 100。保持输入方差不变,在标准的扩展场景(gydF4y2Ba图5一个gydF4y2Ba我们遵循平衡的随机网络的常见方法(gydF4y2Ba范Vreeswijk Sompolinsky, 1998gydF4y2Ba;gydF4y2BaLitwin-Kumar Doiron, 2012gydF4y2Ba)和减少所有无塑性的突触权重乘以他们gydF4y2Ba。此外,我们一半标准差σgydF4y2BaξgydF4y2Ba背景噪音,这样的发射率在相同的范围基线网络。恢复网络的功能方面,需要更多的调优的预测(见gydF4y2Ba补充表4gydF4y2Ba)。gydF4y2Ba
4.1.2。所有cross-columnar连接gydF4y2Ba
在2.5中,基线网络被实例化改性塑料兴奋所有列之间的连接gydF4y2Ba米gydF4y2Ba我gydF4y2Ba→gydF4y2BaTgydF4y2BajgydF4y2Ba,(gydF4y2Ba我gydF4y2Ba≠gydF4y2BajgydF4y2Ba列之间的),而不是仅仅代表连续刺激的元素(见gydF4y2Ba图6gydF4y2Ba)。与基线相比网络gydF4y2Ba图6 bgydF4y2Ba,gydF4y2BaCgydF4y2Ba,所有其他参数都不变。gydF4y2Ba
此外,对于低背景噪音的场景gydF4y2Ba图6 dgydF4y2Ba我们设置gydF4y2BawgydF4y2BaTgydF4y2Ba→gydF4y2Ba我gydF4y2BaTgydF4y2Ba= 0.23 ns,gydF4y2Ba我gydF4y2Ba米gydF4y2Ba= 0.21 ns和gydF4y2BawgydF4y2Ba在gydF4y2Ba= 110 ns。为gydF4y2Ba图6 dgydF4y2Ba,只有gydF4y2Ba我gydF4y2Ba米gydF4y2Ba= 0.21 ns从0.2 ns。gydF4y2Ba
4.1.3。选择与当地抑制线路gydF4y2Ba
功能与网络分析多个修改(见2.6要求gydF4y2Ba图7gydF4y2Ba)。抑制本地连接相应的层,连接gydF4y2Ba和gydF4y2Ba。计时器的细胞gydF4y2BaTgydF4y2Ba我gydF4y2Ba两个项目gydF4y2Ba米gydF4y2Ba我gydF4y2Ba和gydF4y2Ba,以及gydF4y2Ba在其他列gydF4y2BaCgydF4y2BajgydF4y2Ba。在层gydF4y2BalgydF4y2Ba2/3gydF4y2Ba,gydF4y2Ba米gydF4y2Ba我gydF4y2Ba细胞工程gydF4y2BaTgydF4y2Ba我gydF4y2Ba+ 1gydF4y2Ba和gydF4y2Ba。gydF4y2Ba
4.2。神经元模型gydF4y2Ba
网络是由漏integrate-and-fire(生活)神经元,固定电压阈值和conductance-based突触。膜电位的动态gydF4y2BaVgydF4y2Ba我gydF4y2Ba对神经元gydF4y2Ba我gydF4y2Ba如下:gydF4y2Ba
leak-conductance在哪里的gydF4y2BaggydF4y2BalgydF4y2Ba,gydF4y2Ba和gydF4y2Ba代表总兴奋和抑制性突触输入电流,和ξ噪声项与标准差σ建模为高斯白噪声gydF4y2BaξgydF4y2Ba= 100,除非另有说明。这噪音项足以引起低基线活动大约1−2 spks /秒。在达到一个阈值gydF4y2BaVgydF4y2BathgydF4y2Ba=−55 mv (−50 mv抑制性神经元),电压是重置gydF4y2BaVgydF4y2Ba重置gydF4y2Ba的不应期gydF4y2BatgydF4y2Ba裁判gydF4y2Ba= 3。注意,阈值越高抑制性神经元对衰减越快至关重要的活动相比,计时器细胞。gydF4y2Ba
突触传导的动态建模与一种适应性指数函数项,固定的和等于所有突触传导延迟类型。模型的方程动力学,以及总结了所有参数的数值gydF4y2Ba补充表1gydF4y2Ba- - - - - -gydF4y2Ba3gydF4y2Ba。gydF4y2Ba
在所有这些估计数据描述发射率,从高峰火车使用指数滤波器时间常数τgydF4y2BargydF4y2Ba= 40毫秒。gydF4y2Ba
4.3。Eligibility-based学习规则gydF4y2Ba
学习规则的主要假设是两个突触资格的可用性在每个突触痕迹gydF4y2Ba和gydF4y2Ba,代表长期势差(LTP)和抑郁(有限公司),并可同时激活通过Hebbian射击模式。gydF4y2Ba
为gydF4y2Ba一个gydF4y2Ba∈{gydF4y2Bap、dgydF4y2Ba},的动态跟踪:gydF4y2Ba
在τgydF4y2Ba一个gydF4y2Ba是时间常数,ηgydF4y2Ba一个gydF4y2Ba是一个比例因子,gydF4y2Ba跟踪的饱和水平。gydF4y2BaHgydF4y2BaijgydF4y2Ba(gydF4y2BatgydF4y2Ba)是Hebbian术语定义为产品的预处理和突触后神经元的放电率:gydF4y2Ba
与gydF4y2BargydF4y2BathgydF4y2Ba(gydF4y2Ba代表不同的复发性阈值)gydF4y2BaTgydF4y2Ba来gydF4y2BaTgydF4y2Ba(前馈gydF4y2Ba米gydF4y2Ba来gydF4y2BaTgydF4y2Ba)连接。注意,虽然这个方程中使用原始的MATLAB实现和在我们重新在鸟巢,Hebbian条件方程gydF4y2Ba锥和Shouval (2021)gydF4y2Ba是进一步规范化gydF4y2Ba。学习收敛的详细分析,看到最初的研究。gydF4y2Ba
这些活动产生资格痕迹是沉默和瞬态突触标记,可以转化为长期突触强度的变化到第三个因素,gydF4y2BaRgydF4y2Ba(gydF4y2BatgydF4y2Ba),是建模作为全球使用δ函数信号,gydF4y2BaRgydF4y2Ba(gydF4y2BatgydF4y2Ba)=δ(gydF4y2BatgydF4y2Ba−gydF4y2BatgydF4y2Ba奖励gydF4y2Ba−gydF4y2BadgydF4y2Ba奖励gydF4y2Ba在每个发布的),被认为是刺激发病/抵消。尽管通常使用这种编码的信号gydF4y2Ba奖励gydF4y2Ba他们还可以,这里的情况,被陷害gydF4y2Ba新奇的事物gydF4y2Ba信号显示一个新的刺激。因此,突触权重gydF4y2BawgydF4y2BaijgydF4y2Ba通过更新gydF4y2Ba
η(ηgydF4y2BaffgydF4y2Ba前馈)是学习速率。奖励的信号后,持续时间25 ms,痕迹资格是“消费”和重置为零,和他们的激活被设置成一个短的不应期25 ms。在实践中,虽然重量更新跟踪和发展每个奖励期间根据方程(4),他们只是更新的最后审判。然而,这并不影响结果以任何有意义的方式(数据没有显示)。gydF4y2Ba
4.4。刺激协议gydF4y2Ba
刺激输入信号建模为50毫秒步骤,编码为泊松率ν高峰列车gydF4y2Ba在gydF4y2Ba= 30 spks /秒。在基线和扩展网络讨论2.5,这个输入注入gydF4y2BaTgydF4y2Ba我gydF4y2Ba和gydF4y2Ba细胞,突触权重gydF4y2BawgydF4y2Ba在gydF4y2Ba。在2.6讨论的网络中,输入是受限制的gydF4y2BaTgydF4y2Ba我gydF4y2Ba。gydF4y2Ba
网络的训练过程实例由100次试验(除非另有说明),并在每个试验中相应的列是刺激在某些时间点根据输入序列,与元素之间的间隔表示刺激的持续时间。在每个试验的开始,神经元的状态(膜电位)和资格痕迹重设初始值。测试包含多个阶段试验(通常是50),序列的重播在第一列的暗示刺激。gydF4y2Ba
4.5。数值模拟和分析gydF4y2Ba
所有的数值模拟进行了使用修改后的版本的功能神经体系结构(FNA)工具包v0.2.1 (gydF4y2BaDuarte et al ., 2021gydF4y2Ba),一个高级Python框架创建、模拟和评估复杂,以模块化的方式强化神经微电路。它建立在巢pyne接口(gydF4y2BaGewaltig Diesmann, 2007gydF4y2Ba),它提供了核心模拟引擎。确保所有给出的数值实验和数据的复制在这项研究中,并遵守建议提出gydF4y2Ba泡利et al。(2018)gydF4y2Ba,我们提供一个完整的代码包,实现在FNA)(见具体项目的功能gydF4y2Ba补充材料gydF4y2Ba使用巢2.20.0)(gydF4y2BaFardet et al ., 2020gydF4y2Ba)。一致性检查的参考实现中,我们使用gydF4y2BaMATLABgydF4y2BaR2020b版本。gydF4y2Ba
数据可用性声明gydF4y2Ba
所有相关的数据和代码可在公共Zenodo库gydF4y2Bahttps://doi.org/10.5281/zenodo.6418714gydF4y2Ba(gydF4y2BaZajzon et al ., 2023 bgydF4y2Ba,看到也gydF4y2Ba补充材料gydF4y2Ba)。MATLAB代码中使用gydF4y2Ba锥和Shouval (2021)gydF4y2Ba和修正中引用(gydF4y2Ba锥和Shouval, 2023gydF4y2Ba)可以在ModelDB存储库中找到gydF4y2Bahttp://modeldb.yale.edu/266774gydF4y2Ba。gydF4y2Ba
作者的贡献gydF4y2Ba
,RD,我设计的学习和写作手稿。BZ重新实现模型和执行所有的模拟和分析。所有作者的文章和批准提交的版本。gydF4y2Ba
资金gydF4y2Ba
这项工作已收到部分主动权和网络的支持基金亥姆霍兹联合会,亥姆霍兹组合主题超级计算和建模对于人类的大脑,和德国联邦政府和州政府的卓越计划(G: (de - 82) EXS-SF-neuroIC002]。开放获取出版由德意志Forschungsgemeinschaft(脱硫、德国研究基金会)-491111487。gydF4y2Ba
确认gydF4y2Ba
作者欣然承认计算时间给予JARA-HPC Vergabegremium超级计算机JURECA (gydF4y2Baj超级计算中心,2021年gydF4y2Ba在j Forschungszentrum)。此外,我们要感谢Charl林森神经科学实验室模拟和数据支持神经元和突触模型实现。gydF4y2Ba
的利益冲突gydF4y2Ba
作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。gydF4y2Ba
出版商的注意gydF4y2Ba
本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。gydF4y2Ba
补充材料gydF4y2Ba
本文的补充材料在网上可以找到:gydF4y2Bahttps://www.雷竞技rebatfrontiersin.org/articles/10.3389/fnint.2023.935177/full补充材料gydF4y2Ba
脚注gydF4y2Ba
引用gydF4y2Ba
Arieli,。,年代terkin, A., Grinvald, A., and Aertsen, A. (1996). Dynamics of ongoing activity: explanation of the large variability in evoked cortical responses.科学gydF4y2Ba273年,1868 - 1871。doi: 10.1126 / science.273.5283.1868gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
8月,D。,levy, W. (1999). Temporal sequence compression by an integrate-and-fire model of hippocampal area CA3.j .第一版。>gydF4y2Ba。6,71 - 90。doi: 10.1023 /: 1008861001091gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Benureau, f . c . Y。,Rougier, N. P. (2018). Re-run, repeat, reproduce, reuse, replicate: transforming code into scientific contributions.前面。NeuroinformgydF4y2Ba。11:69。doi: 10.3389 / fninf.2017.00069gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Bitterman Y。Mukamel, R。Malach, R。、炒我。,Nelken, I. (2008). Ultra-fine frequency tuning revealed in single neurons of human auditory cortex.自然gydF4y2Ba451年,197 - 201。doi: 10.1038 / nature06476gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Bouhadjar Y。,Wouters, D. J., Diesmann, M., and Tetzlaff, T. (2021). Sequence learning, prediction, and replay in networks of spiking neurons.arXiv: 2111.03456gydF4y2Ba。doi: 10.1371 / journal.pcbi.1010233gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
布朗,s P。,Hestrin, S. (2009). Intracortical circuits of pyramidal neurons reflect their long-range axonal targets.自然gydF4y2Ba457年,1133 - 1136。doi: 10.1038 / nature07658gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
锥,我。,年代houval, H. Z. (2021). Learning precise spatiotemporal sequences via biophysically realistic learning rules in a modular, spiking network.eLifegydF4y2Ba10:e63751。doi: 10.7554 / eLife.63751.sa2gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
锥,我。,年代houval, H. Z. (2023). Correction: learning precise spatiotemporal sequences via biophysically realistic learning rules in a modular, spiking network.eLifegydF4y2Ba12:e87507。doi: 10.7554 / eLife.87507gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
德弗里斯,s·e·J。Lecoq, j。Buice, m。,Groblewski, P. A., Ocker, G. K., Oliver, M., et al. (2020). A large-scale standardized physiological survey reveals functional organization of the mouse visual cortex.Nat。>gydF4y2Ba。23日,138 - 151。doi: 10.1038 / s41593 - 019 - 0550 - 9gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Dehaene, S。,米eyniel, F., Wacongne, C., Wang, L., and Pallier, C. (2015). The neural representation of sequences: from transition probabilities to algebraic patterns and linguistic trees.神经元gydF4y2Ba88年,三分之一的。doi: 10.1016 / j.neuron.2015.09.019gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
道格拉斯,r . J。,米一个rt在,K. (2004). Neuronal circuits of the neocortex.为基础。启>gydF4y2Ba。27日,419 - 451。doi: 10.1146 / annurev.neuro.27.070203.144152gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
杜阿尔特,R。,Uhlmann, M., van den Broeck, D., Fitz, H., Petersson, K. M., and Morrison, A. (2018). “Encoding symbolic sequences with spiking neural reservoirs,” in国际神经网络联合会议学报》上gydF4y2Ba(里约热内卢),1 - 8。doi: 10.1109 / IJCNN.2018.8489114gydF4y2Ba
CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
杜阿尔特,R。,Zajzon B。,年代chulte to Brinke, T., and Morrison, A. (2021). Functional neural architectures (0.2.1).Zenodo。gydF4y2Badoi: 10.5281 / zenodo.5752597gydF4y2Ba
CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
杜阿尔特,r·c·F。,米或r我son, A. (2014). Dynamic stability of sequential stimulus representations in adapting neuronal networks.前面。第一版。>gydF4y2Ba。8:124。doi: 10.3389 / fncom.2014.00124gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Fardet, T。,Vennemo, S. B., Mitchell, J., Mørk, H., Graber, S., Hahne, J., et al. (2020).2.20.0筑巢。Zenodo。gydF4y2Badoi: 10.5281 / zenodo.3605514gydF4y2Ba
CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Fiete, i R。森,W。,Wang, C. Z., and Hahnloser, R. H. (2010). Spike-time-dependent plasticity and heterosynaptic competition organize networks to produce long scale-free sequences of neural activity.神经元gydF4y2Ba65年,563 - 576。doi: 10.1016 / j.neuron.2010.02.003gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
非诺,E。,Yuste, R. (2011). Dense inhibitory connectivity in neocortex.神经元gydF4y2Ba69年,1188 - 1203。doi: 10.1016 / j.neuron.2011.02.025gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
惠誉,w . T。,米一个rt在s, M. D. (2014). Hierarchical processing in music, language, and action: Lashley revisited.安。纽约大学专科学校科学gydF4y2Ba。1316年,87 - 104。doi: 10.1111 / nyas.12406gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
菲茨,H。,Uhlmann, M., Van Den Broek, D., Duarte, R., Hagoort, P., and Petersson, K. M. (2020). Neuronal spike-rate adaptation supports working memory in language processing.Proc。国家的。学会科学。美国gydF4y2Ba。117年,20881 - 20889。doi: 10.1073 / pnas.2000222117gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Fremaux, N。,郭士纳,W。,Fremaux, N. (2015). Neuromodulated spike-timing-dependent plasticity, and theory of three-factor learning rules.前面。神经回路gydF4y2Ba9:85。doi: 10.3389 / fncir.2015.00085gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
副食,S。,米我ller, E. K., and Rigotti, M. (2016). Why neurons mix: high dimensionality for higher cognition.咕咕叫。当今。一般人gydF4y2Ba。37岁,66 - 74。doi: 10.1016 / j.conb.2016.01.010gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Gavornik, j . P。,Bear, M. F. (2014). Learned spatiotemporal sequence recognition and prediction in primary visual cortex.Nat。>gydF4y2Ba。17日,732 - 737。doi: 10.1038 / nn.3683gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
郭士纳,W。,lehmann, M., Liakoni, V., Corneil, D., and Brea, J. (2018). Eligibility traces and plasticity on behavioral time scales: experimental support of NeoHebbian three-factor learning rules.前面。神经回路gydF4y2Ba12:53。doi: 10.3389 / fncir.2018.00053gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Gewaltig M.-O。,Diesmann, M. (2007). NEST (neural simulation tool).ScholarpediagydF4y2Ba2:1430。doi: 10.4249 / scholarpedia.1430gydF4y2Ba
CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
哈里斯,k·D。,年代hepherd, G. M. (2015). The neocortical circuit: themes and variations.Nat。>gydF4y2Ba。18日,170 - 181。doi: 10.1038 / nn.3917gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
他,K。,Huertas, M., Hong, S. Z., Tie, X., Hell, J. W., Shouval, H., et al. (2015). Distinct eligibility traces for LTP and LTD in cortical synapses.神经元gydF4y2Ba88年,528 - 538。doi: 10.1016 / j.neuron.2015.09.037gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
海宁,S。,Turk-Browne, N. B., Friedman, D., Liu, A., Dugan, P., Flinker, A., et al. (2021). Learning hierarchical sequence representations across human cortex and hippocampus.科学。阿德gydF4y2Ba。7:eabc4530。doi: 10.1126 / sciadv.abc4530gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
休博尔,d . H。,Wiesel, T. N. (1959). Receptive fields of single neurones in the cat's striate cortex.j .杂志gydF4y2Ba。148年,574 - 591。doi: 10.1113 / jphysiol.1959.sp006308gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
韦尔塔,m·A。,年代chwettmann, S. E., and Shouval, H. Z. (2016). The role of multiple neuromodulators in reinforcement learning that is based on competition between eligibility traces.前面。Synapt。>gydF4y2Ba。37。doi: 10.3389 / fnsyn.2016.00037gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
韦尔塔,m·A。,年代huler, M. G. H., and Shouval, H. Z. (2015). A simple network architecture accounts for diverse reward time responses in primary visual cortex.j . >gydF4y2Ba。35岁,12659 - 12672。doi: 10.1523 / jneurosci.0871 - 15.2015gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Hupkes D。,Dankers, V., Mul, M., and Bruni, E. (2019). Compositionality decomposed: how do neural networks generalise?arXiv: 1908.08351gydF4y2Ba。doi: 10.24963 / ijcai.2020/708gydF4y2Ba
CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
j超级计算中心(2021)。JURECA:数据中心和升压模块实现模块化j超级计算中心的超级计算机体系结构。gydF4y2Baj .大规模Facil >gydF4y2Ba。7:A182。doi: 10.17815 / jlsrf - 7 - 182gydF4y2Ba
CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Klampfl, S。,米一个一个ss, W. (2013). Emergence of dynamic memory traces in cortical microcircuit models through STDP.j . >gydF4y2Ba。33岁,11515 - 11529。doi: 10.1523 / jneurosci.5044 - 12.2013gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
绝,C。,米我ner, D., and Triesch, J. (2018). Bridging structure and function: a model of sequence learning and prediction in primary visual cortex.公共科学图书馆第一版。医学杂志gydF4y2Ba。14:e1006187。doi: 10.1371 / journal.pcbi.1006187gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Litwin-Kumar,。,Doiron, B. (2012). Slow dynamics and high variability in balanced cortical networks with clustered connections.Nat。>gydF4y2Ba。15日,1498 - 1505。doi: 10.1038 / nn.3220gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
刘,学术界。,Coleman, J. E., Davoudi, H., Zhang, K., and Shuler, M. G. H. (2015). Selective activation of a putative reinforcement signal conditions cued interval timing in primary visual cortex.咕咕叫。医学杂志。gydF4y2Ba25日,1551 - 1561。doi: 10.1016 / j.cub.2015.04.028gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
梅斯,一个。,B一个r一个hona, M., and Clopath, C. (2021). Learning compositional sequences with multiple time scales through a hierarchical network of spiking neurons.公共科学图书馆第一版。医学杂志gydF4y2Ba。17:e1008866。doi: 10.1371 / journal.pcbi.1008866gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
麦基,j . C。,Grienberger, C. (2020). Synaptic plasticity forms and functions.为基础。启>gydF4y2Ba。43岁,95 - 117。doi: 10.1146 / annurev -神经- 090919 - 022842gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Mongillo G。巴拉克,O。,Tsodyks, M. (2008). Synaptic theory of working memory.科学gydF4y2Ba319年,1543 - 1546。doi: 10.1126 / science.1150769gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Mountcastle v . b . (1997)。大脑皮层的柱状组织。gydF4y2Ba大脑gydF4y2Ba120年,701 - 722。大脑/ 120.4.701 doi: 10.1093 /gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
穆雷,j . M。,Escola, G. S. (2017). Learning multiple variable-speed sequences in striatum via cortical tutoring.eLifegydF4y2Ba6。doi: 10.7554 / eLife.26084.011gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
泡利,R。,Weidel, P., Kunkel, S., and Morrison, A. (2018). Reproducing polychronization: a guide to maximizing the reproducibility of spiking network models.前面。NeuroinformgydF4y2Ba。46。doi: 10.3389 / fninf.2018.00046gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Plesser h。e . (2018)。再现性和可复制性:简史术语混淆。gydF4y2Ba前面。NeuroinformgydF4y2Ba。11:76。doi: 10.3389 / fninf.2017.00076gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Porr B。,Wörgötter, F. (2007). Learning with “relevance”: using a third factor to stabilize Hebbian learning.神经第一版gydF4y2Ba。19日,2694 - 2719。doi: 10.1162 / neco.2007.19.10.2694gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Rigotti, M。巴拉克,O。,Warden, M. R., Wang, X.-J., Daw, N. D., Miller, E. K., et al. (2013). The importance of mixed selectivity in complex cognitive tasks.自然gydF4y2Ba497年,585 - 590。doi: 10.1038 / nature12160gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Brinke, t·S。杜阿尔特,R。,米或r我son, A. (2022). Characteristic columnar connectivity caters to cortical computation: replication, simulation, and evaluation of a microcircuit model.前面。中国。>gydF4y2Ba。16:923468。doi: 10.3389 / fnint.2022.923468gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
加拿大,R。李,S。,Rudy, B. (2016). GABAergic Interneurons in the Neocortex: from cellular properties to circuits.神经元gydF4y2Ba91年,260 - 292。doi: 10.1016 / j.neuron.2016.06.033gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Tripathy, s . J。伯顿,s D。Geramita, M。,Gerkin, R. C., and Urban, N. N. (2015). Brain-wide analysis of electrophysiological diversity yields novel categorization of mammalian neuron types.j . NeurophysiolgydF4y2Ba。113年,3474 - 3489。doi: 10.1152 / jn.00237.2015gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
van Albada, s . J。Helias, M。,Diesmann, M. (2015). Scalability of asynchronous networks is limited by one-to-one mapping between effective connectivity and correlations.公共科学图书馆第一版。医学杂志gydF4y2Ba。11:e1004490。doi: 10.1371 / journal.pcbi.1004490gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
van Vreeswijk, C。,年代ompolinsky, H. (1998). Chaotic balanced state in a model of cortical circuits.神经第一版gydF4y2Ba。10日,1321 - 1371。doi: 10.1162 / 089976698300017214gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
沃克,k . M . M。Bizley, j·K。王,a·J。,年代chnupp, J. W. H. (2011). Multiplexed and robust representations of sound features in auditory cortex.j . >gydF4y2Ba。31日,14565 - 14576。doi: 10.1523 / jneurosci.2074 - 11.2011gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
威尔逊,B。,年代p我erings, M., Ravignani, A., Mueller, J. L., Mintz, T. H., Wijnen, F., et al. (2018). Non-adjacent dependency learning in humans and other animals.上面。Cogn。ScigydF4y2Ba。12日,843 - 858。doi: 10.1111 / tops.12381gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
徐,S。,Jiang, W., Ming Poo, M., and Dan, Y. (2012). Activity recall in a visual cortical ensemble.Nat。>gydF4y2Ba。15日,449 - 455。doi: 10.1038 / nn.3036gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Zajzon B。,杜阿尔特,R。,米一个hmoudian, S., Morrison, A., and Duarte, R. (2019). Passing the message: representation transfer in modular balanced networks.前面。第一版。>gydF4y2Ba。13:79。doi: 10.3389 / fncom.2019.00079gydF4y2Ba
《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Zajzon B。,杜阿尔特,R。,米或r我son, A. (2023a). Source code for “Towards reproducible models of sequence learning: replication and analysis of a modular spiking network with reward-based learning”.Zenodo。gydF4y2Badoi: 10.5281 / zenodo.6418714gydF4y2Ba
CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
Zajzon B。,杜阿尔特,R。,米或r我son, A. (2023b). Towards reproducible models of sequence learning: replication and analysis of a modular spiking network with reward-based learning. doi: 10.1101/2023.01.18.524604
CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba
关键词:gydF4y2Ba再现性、序列学习模型、模块化、半球学习,强化网络gydF4y2Ba
引用:gydF4y2BaZajzon B, Duarte R和莫里森(2023)向可再生的模型的序列学习:复制和分析模块化飙升奖励网络基础的学习。gydF4y2Ba前面。中国。>。gydF4y2Ba17:935177。doi: 10.3389 / fnint.2023.935177gydF4y2Ba
收到:gydF4y2Ba2022年5月3日;gydF4y2Ba接受:gydF4y2Ba2023年5月15日;gydF4y2Ba
发表:gydF4y2Ba2023年6月15日。gydF4y2Ba
编辑:gydF4y2Ba
阿尔贝托萨曼塔gydF4y2Ba意大利米兰理工大学,gydF4y2Ba版权gydF4y2Ba©2023 Zajzon Duarte和莫里森。这是一个开放分布式根据文章gydF4y2Ba知识共享归属许可(CC)gydF4y2Ba。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。gydF4y2Ba
*通信:gydF4y2BaBarna Zajzon,gydF4y2Bab.zajzon@fz-juelich.degydF4y2Ba