的方法量化人口使用生态模型之间的交互
- 1生物医学工程系,乔治亚理工学院和埃默里大学,亚特兰大,乔治亚州,美国
- 2中心微生物动力学和感染,亚特兰大,乔治亚州,美国
- 3生物科学学院乔治亚理工学院,亚特兰大,乔治亚州,美国
(LV)生态模型介绍了20世纪初来描述捕食系统。自那以后,该模型已经扩展捕捉各种各样的相互作用的动态人口和包括来自环境的外部因素的影响。尽管许多简化的假设,LV的方法已经被证明是一个非常有价值的工具,获得洞察多样化的生物相互作用的动态系统。特别是,识别关键微生物对人类和环境卫生的重要性,LV系统已经成为分析的有效工具,实际上,默认为定量评估在这些大的微生物群落的相互作用。这里我们提出一个LV系统参数推理方法的概述,具体解决个人进入biomathematical建模领域,有温和的背景在线性代数和微积分。的方法包括传统的本地和全球战略,以及最近开发严格基于线性代数推理方法。我们比较不同的策略使用lab-acquired和合成时间序列数据。我们还地址最近的辩论在科学界是否合法组成大型模型的信息推断出亚种群的动力学。除了参数估计方法,概述包括准备方面的推理过程,包括数据清洗、平滑,足够的损失函数的选择。我们的比较证明,传统的装配策略,如梯度下降优化和微分进化,倾向于收益率低残差但有时overfit嘈杂的数据和产生高计算成本。 The linear-algebra-based method produces a satisfactory solution much faster, generally without overfitting, but requires the user to estimate slopes from the time series, which can introduce undue error. The results also suggest that composing large models from information regarding sub-models can be problematic. Overall, there is no clear “always-best method” for inferring parameters from data, and prudent combinations may be the best strategy.
背景
生态(LV)建模框架介绍了20世纪早期的生物物理学家阿尔弗雷德·洛特卡(洛特卡,1920)和数学家维托沃尔泰拉(沃尔泰拉1926)来描述捕食系统。这些年来,框架已经扩展捕捉的动态人口众多类型的互动,也包括外部因素的影响,从环境(斯坦et al ., 2013;大坝et al ., 2020)。传统的LV模型结构是简单的因为它使几个假设,这是,严格来说,不是真的。这些包括恒常性食品供应的猎物,缺乏(生理或进化)适应所有参与的数量,和初始尺寸之间的比例每个人口及其增长率,收益率指数增长如果人口受他人影响。尽管这些简单化的假设,LV模型已经被证明是一个非常有价值的工具,获得洞察众多多样化的生物相互作用的动力学系统,例如,在不同哺乳动物或鱼类(Wangersky 1978),细菌湖社区(大坝et al ., 2016)和淡水纤毛虫(Muhlbauer et al ., 2020),这些只是其中一部分。此外,认识到的重要性近年来微生物,LV系统已经成为一个有效的分析工具,实际上,默认为定量评估交互在这些大的微生物群(Mounier et al ., 2007;Buffie et al ., 2015;Dakos et al ., 2020;迪马斯马丁斯和Gjini, 2020)。LV模型而且已经提出了旅游环境,如物理(Nambu 1986;Hacinliyan et al ., 2010)、经济学(2012年蒋介石,),解决污染问题(哈斯,1981;周和陈,2006年)。最后,严格的数学分析证明LV模型结构,而刚性和简单,是非常丰富的,的确能够捕获任何可微非线性如果足够许多“辅助”介绍了变量LV格式(佩舍尔曼德,1986;我们和Savageau, 1986;HernandezBermejo Fairen, 1997)。这些非线性包括整个光谱,从单调轨迹分岔,阻尼和稳定的振荡和确定性混沌(Sprott et al ., 2005;Vano et al ., 2006)。有时,LV模型被认为是老式的伪劣更多现代系统生物学的方法。然而,由于其简单和直观的结构,他们通常是优秀的基线模型潜在的比较更复杂的模型。有人可能会添加LV模型用于近500 PubMed-listed独自研究在过去的十年。
通用LV系统n数量或种类x我的形式:
的非负参数
为一个物种(的情况下n= 1),LV模型简化逻辑斯蒂方程
(Verhulst 1838)。增长率,
承载能力项隐式地包含信息的空间和营养环境的物种。例如,它已被证明,最初的碳的数量可用于细菌培养,有利于物种的承载能力(Rattray et al ., 2022)。
细菌群体的典型生长曲线在实验环境下有三个阶段(图1)(马迪根2015)。在最初的停滞阶段(洛特卡,1920),人口不增长那么多,随着细菌适应新环境或实验条件和优化他们的代谢反应。这种停滞阶段并不总是在实验环境下观察到。在随后的指数期(沃尔泰拉1926),细菌迅速分裂。这个阶段结束的必需营养素消耗或浪费的产品进一步抑制经济增长。因此,人口进入固定相(大坝et al ., 2020),增长率和死亡的细胞大致相等。可以添加到这些阶段第四个下降(或死亡)阶段尽快,细胞不再分裂他们死亡,从而导致人口密度减少,这经常被建模为一个指数衰减函数。这个分类阶段有点简单,和其他阶段,如diauxic增长和不同死亡阶段,可以观察到在一个实际的设置(纳瓦罗Llorens et al ., 2010;Boulineau et al ., 2013)。
图1。典型的实验和模拟单个细菌人口的增长趋势。彩色圆点代表四个复制的生长曲线大肠杆菌(见方法)。黑色曲线表示数据的符合逻辑斯蒂方程(单变量的LV
注意生态模型并不占一般细菌的死亡阶段人口增长曲线,地址的静态环境条件。原则上,按时间的环境因素,如底物可用性,可以通过附加的条款纳入LV方程(斯坦et al ., 2013;大坝et al ., 2020),但这样的环境数据很少实验(Piccardi et al ., 2019)。在实践中,点在衰减阶段往往忽视,尽管他们可能符合一些额外的功能。另一种物种的生态模型增长是莫诺方程(莫诺1949),它包含一个限制衬底,如碳水化合物。逻辑斯蒂方程可以被看作是一种特殊情况的莫诺方程(Kargi 2009)。虽然莫诺方程存在大型化版本(豪氏威马,weis 1999),这个方程不占不资源物种相互作用介导和需要时间跟踪的限制资源,这是一个主要的实际限制除了其他技术的局限性模型(Muloiwa et al ., 2020)。
两变量的情况下(n= 2)为每个物种生态模型包括三个方面:一个增长术语(
每一种间相互作用项的符号代表的两个物种之间的关系类型,可分为中给出表1。所有条款之间的平衡在这些方程确定社区的动态。
对于更大的社区,如食物网和人类或环境微生物,这些增长和交互参数的值通常是未知的,甚至常常不清楚先天的无论他们是积极的,消极的或零。然而,随着这些交互的本质是需要理解的动态混合社区,通常是定量的主要目标LV分析推断出类型的物种间的相互作用,因此,交互参数的迹象。交互的优势,即参数值的大小,是很重要的,至少在某种程度上,因为他们是用来评估系统的稳定性(Allesina和唐,2012)。参数标志和值的推理从观测数据计算实现与优化参数估计的方法。典型方法,稍后讨论,包括网格搜索,梯度下降方法,不同的进化算法,如遗传、蚁群或群算法,模拟退火,以及更新的方法基于线性代数。对于一般的介绍典型的数值优化方法见(Nocedal和赖特,2006年)。在本文中,我们提供了一个温和的介绍非线性微分方程系统的参数估计。作为我们的重点,我们审查和比较方法专门为代表的概念推断LV模型的参数从观测时间序列数据,利用微生物群落作为我们的中心目标。我们还讨论准备数据管理步骤,便于推理过程。
应用微生物群落的生态模型
日益增长的重要性的认识的多种微生物群落恢复了LV系统的兴趣。最近的研究表明,LV可以是一个很好的近似nutrient-limited和复杂的微生物系统(Dedrick et al ., 2022)。作为例子,代表Buffie等人利用LV模型评估的出现梭状芽孢杆菌在抗生素治疗胃肠道(Buffie et al ., 2015);Venturelli等人研究了合成的社区交互使用twelve-species系统(Venturelli et al ., 2018);和Mounier等人的互动社区内的奶酪微生物(Mounier et al ., 2007)。
将简单的数学模型应用于微生物面临着挑战与关键假设并不一定适用于细菌社区(堡,2020)。这些假设假定为LV模型:
1。人口是混合;
2。所有参数都是固定的时间(即。,没有环境变化,生理适应,监管变化或进化变化是考虑);
3所示。没有高阶相互作用在某种意义上,例如,三个物种可能会改变物种1和2之间的交互。
在实验环境下,研究人员可以为这些问题在一定程度上控制,例如,通过不断摇晃的文化在增长(假设1)或只有两个物种在一起(假设3)。假设两个的环境变化可能通过使用恒化器来解决,然而仍然允许对适应性和进化(格雷沙姆·邓纳姆,2014年)。
本研究中使用的数据
对于本文,我们将使用略有不同性质的三个数据集允许我们强调数据分析的各个方面和LV的推理参数值数据的一种有效方式。计算模拟数据的一个由四个物种生长在同一个社区的环境。此数据集的优势是,我们有完整的互动和知识因此可以最直观的评估不同的方法的有效性。另两种情况解决实际的实验数据集,它使我们在实践中探索各种方法的可行性和适用性。首先,我们检查一次四个物种模型来源于一个工业上下文(Piccardi et al ., 2019);然后我们检查三种微生物群落组成和研究实验新创。
合成微生物
从模拟合成数据集创建LV系统,由四个物种的轨迹,有或没有叠加噪声。所有参数(增长率、承载能力和交互计算)选择的范围内下降2到2.5(见补充表S5)。数据设计的,在各种场景中所有物种共存。
四个物种功能微生物
作为第一个现实的应用程序中,我们分析的数据集Piccardi最近发表的et al。(Piccardi et al ., 2019)。作者培养四种细菌的数量能够降解的金属加工液(MWF),一个工业冷却剂和润滑剂。这种液体是有趣的,因为它既包含生长基质和有毒的杀虫剂。作者的目标是确定流体的毒性影响物种之间的相互作用。量化这些交互通过比较每个物种的生长曲线。具体地说,他们使用作为比较指标的(增长)曲线下的面积(AUC),这是获得合适的观察几个时间点。作者认为一个物种的AUC值较低,生长在另一种生物的存在,AUC值在单作相比增长将显示负相互作用,反之亦然。我们为插图使用的数据补充图S8(Piccardi et al ., 2019)。
三种微生物
除了合成和以前公布的数据集,我们组成新创三个模型的一个社区细菌物种,霍乱弧菌、金黄色葡萄球菌、和大肠杆菌(崔et al ., 2005;Ibberson et al ., 2016;麦克纳利et al ., 2017),所有结构上产生不同的荧光蛋白。这种荧光允许每小时荧光跟踪三每日通道(图2)。实验在单作,成对,完整的3种社区。我们使用了一个等于1的比率(或1μl / 40μl)细胞生长在一夜之间从每个单一的新媒介成对实验;一60作为接种体的比例三种实验。数据在网上都可以查阅,(戴维斯et al ., 2022)。
初步的推理步骤参数
数据准备
中提取的增长和交互参数时间序列数据集,建议安排数据的格式,便于计算分析可行。准备可能会开始“清洗”通过消除重复的数据,统计上显著的异常值,和处理缺失值,通过推断他们或删除可疑观测统计诊断(Rousseeuw和休伯特,2011;Aggarwal 2017)。如果需要,数据必须转换成相同的标准单位,如每毫升集落形成单位(CFU /毫升)的细菌。这一步通常需要校准,收集了数据可能有不同的方法,产生发光(勒克斯),相关单位相对荧光(RFU),或光密度(OD)。对于大多数数学和统计方法,它有助于组织数据矩阵形式或一个数据帧格式,第一列代表时间和随后的列是观察。一个例子是一个常见的格式等# # # . csv或# # # . txt。数据清理的彻底,看(Van den Broeck et al ., 2005)。
处理一段数据
微生物学的研究人员经常感兴趣的实验系统中多个物种的稳定状态,包括所有参与人口的绝对或相对大小的情况这些数字并没有改变。虽然稳态丰度的直接测量可能在许多生态系统,在体外实验构成的挑战:资源之前经常使用的物种有机会达到这个平衡。为了克服这个问题,常见的做法是“通道”细胞,也就是说,采取(整除)的一小部分细胞(通常1 - 10%),从介质删除它们,并将它们添加到新鲜培养基(图3)。虽然这个过程有助于防止人口衰减,它使得建模过程更加困难,作为一个必须处理不连续在每个通道,这是和微分方程模型,包括生态系统。这个问题可以通过事件处理解决:在许多歌唱,回调函数可以通过停止仿真实现在指定条件(即。,在特定的时间或当一个变量达到某个值)。该系统可以修改和仿真的简历(图4)。
图3。实验结果的新创3种系统。列面板显示培养的物种的不同组合(如,和=弧菌和葡萄球菌观察到的物种),每个面板显示比例在不同的段落。通道1、2和3发生在24日,48岁,分别和72 h。每个通道包含25小时测量(t= 0t= 24)。行代表生物复制的实验。黑色线表示整个社区大小在不同的时间点。y轴左边显示的相对含量,而右边的轴代表社区规模的对数。
图4。实验和模拟两个细菌种群的增长曲线使;从新创数据集。在这个例子中,我们在24小时通过2.5%的细胞,导致减少1/40的密度在24小时的时间点。在ODE求解器,我们计划一个回调:当解算器t我们所有的数量除以40 = 24日。这个回调允许我们使用我们的正常参数估计方法尽管不连续。
善良的指标符合损失函数
模型可以适合数据之前,必须选择一个指标决定的两套模型参数提供了更好的适合给定的数据集。的主要标准是一般的价值损失函数,描述了不同的估计模型预测真实数据。根据这一指标,参数估计的最优解问题的参数集对应于一个模型与最小的损失函数实例化。
几个常用的损失函数。最普遍的违约是平方误差的总和,上交所,上交所除以估计参数的数量,上交所/p,或者是上交所除以数据点的数量,上交所/n。频繁的选择包括平均绝对误差(MAE)和确定系数(R2),该措施因变量方差的比例,可以解释为独立变量。(里德,2010)。
我们的分析将使用SSE,平方之和每个数据点之间的差异和预测模型估计在这一点上:
对于一个完美的解决方案,这个总和等于0,但任何水平的噪音会导致更高的价值。因此,我们确定的参数集的最小残差。
“正规化”是一个过程,一个或多个处罚条款添加到损失函数为了解决病态问题或防止过度拟合的数据(Neumaier 1998)。套索(L1-norm)正规化寻求最小化SSE,同时最小化零参数的数量。这个任务是通过添加一个正规化设置的hyperparameter
必须优化λ,加上其他参数,给出一个最优,从而使该方法计算更加昂贵。套索正规化背后具体来说,大意是,一个小的改善SSE可能不值得如果零参数的数量增加。换句话说,研究者必须平衡两个量,并非真正的可比性:上交所和非零参数的数量。由于这需要平衡,
另一种正则化方法是脊(“L2-norm”,或Tikhonov)回归(Tikhonov et al ., 1995),优化的目标是平衡数据符合所有参数的总大小:
脊方法趋向于最小化所有参数的值,因此惩罚参数与大大小,但它一般不会删除参数模型。方法设计了确定hyperparameter的最优值
因此,套索回归倾向于产生稀疏的参数集,因此应与最低限度的复杂模型,适合大型系统使用岭回归时经常使用所有可用的参数,但往往会避免极端情况下的参数值。
弹性网方法结合L1和L2合法化:
尽管这种方法受益,套索和岭回归的概念,弹性净回归显然需要优化两个λhyperparameters (邹Hastie, 2005)。图5和表2说明了各种方法之间的差异。
图5。正则化方法的比较Piccardi制度et al。(Piccardi et al ., 2019)。虽然估计大概overfitted不受任何惩罚,其他三种方法产生更为顺畅的解决方案。显示的数据代表的增长c . testosteroni4新种的实验。三个点在每个计算代表三个生物复制。补充额外的物种所示的结果。
的例子图5,所有三种方法使用一个惩罚项对一个物种也有类似的曲线显示,但非常不同的参数,无论是数量和大小(见补充表S1)。没有惩罚项的估计误差最低但似乎过度拟合数据,基于生物假设之间,除了少数小时50和150年不太可能是真的,因此该模型符合“追逐噪音”数据。套索和弹性网方法缩小参数的数量从20到7或9,分别。在这两个估计,所有四个方面保持增长,一起
除了考虑模型和数据之间的差异,可能重要的额外标准选择一个损失函数是“正常化”,这是通过将每个剩余价值的数据点。这一步可能有用的情况下操作的变量在不同的数量级,否则高价值的变量上的噪音可能主宰SSE,从而导致贫穷适合低价值变量。它可能而且是有益的称量数据中离群值的重要性。第十章(就是一个很好的参考Hastie et al ., 2009)。
上交所,有或没有正规化和规范化,可以说是最重要的标准,最小残差不应该是唯一的标准,有几个原因(我们2011)。首先,一个人应该记住一个高维多项式的极端的例子,可以构建适合任何有限数据集完美(Camporeale 2019)。在上交所因此0,使用这种方法的一个问题是,其参数值没有太多生物意义。多项式有另外两个问题:第一,甚至删除或添加一个数据点通常改变整个参数集多项式的系数显著。第二,推断向更高价值的独立变量往往收敛于∞-∞。
有些相关问题唯一专注于上交所过度拟合,我们看到在某种程度上图4,可能是由于模型参数的使用超过必要的数据。在某种程度上,过度拟合,离开能诊断数据点的拟合过程,再次拟合,比较结果参数设置。如果这些差异很大,过度拟合是一个可能的解释。实际上,估计应该执行的数据点(百分比训练集)和验证(剩下的点验证设置)(Hasdemir et al ., 2015)。外的许多其他问题之间的残差数据和模型应该考虑当决定在“最好”的解决方案(我们2011)(图5)。
局部最小值
它经常发生,系统的参数化收益率许多良好的解决方案,然而,包括有些甚至完全不同的参数值,如早些时候正规化的例子所示。原因可以是整个解决方案域的存在具有相同或非常相似的党卫军。一个场景都是一个完整的(一个或多维)表面或域的解决方案完全相同的党卫军,搜索算法确定所有点的最优解决方案。也有可能不同的参数集收益率SSE值如此相似,优化器不能区分它们。另一个可能性是,每个点(即。参数集)在这个域对应于一个孤立局部最小值,即。,一点小损失函数(略)较大的包围,局部优化往往会找到。最小的损失函数值在整个搜索空间发现的全球最低,但这往往是很难获得确切的点。全局优化,如进化算法、网格搜索,和抽样方法,旨在找到全球最低,但他们通常只揭示了全球最低的社区通过停止之前还没有找到确切的价值。
多个具有类似ss和整体建模的参数化
虽然数学有趣,绝对最小SSE之间的差异和参数设置值略高生物无关,它可能会比确定所有参数设置与上交所足够小。毕竟,复制或多个场景的数据很有可能导致在解决方案域略有不同的答案。因此,现代的方法这个问题而不是追求绝对最优识别整个集群的不同,almost-optimal解决方案。之后这个标识的使用统计方法来评估多少可能不同参数组合没有显著影响数据的准确性符合(图6)。这种方法被称为整体建模(Kuepfer et al ., 2007;李et al ., 2014)。
图6。密度图的参数值复制的所有组合。四个物种情况三个复制Piccardi的数据集et al。(Piccardi et al ., 2019)允许三个rank-four复制和三个复制删除每一物种,总共3 ^ 4不同的组合。相同的参数的值推断出从81年的每一个组合显示在橙色和绿色的意思是表示点。在这里,参数的平均值约为-1.48 * 10-10年,标准偏差为3.96 * 10-10年。蓝分布曲线是利用核密度估计。
自顶向下或自底向上?
一个有趣的估计问题特定的混合社区是推断的总体战略的交互系统。应该执行复制的实验与所有感兴趣的人群,然后估计所有交互(自顶向下),还是一个相反(自下而上)创建单一实验估计增长和饱和度参数为每个物种,那么生态实验,两两相互作用参数的推断,然后先后大社区,在早些时候从先前的实验参数值被认为是已知的吗?这两种策略呈现强劲的利弊,大部分答案是由系统的大小,它变得明显从适度大型系统的一个思想实验:推断出系统参数
相反,假设两个或三个物种的相互作用参数对共培养一次从相应的实验和估计这些物种的新实验+一个或两个新物种被分析。考虑到二次参数描述一个社区(增加
因此,自底向上的方法提供了一个“专业”的解剖一个大型优化成更小的任务,每一个必须处理大大减少“免费”参数,这将使估计的问题更容易解决,需要更少的计算时间和最小化冗余参数之一。另外,每个解决方案空间将会大大减少维度,这就增加了可能性,搜索算法能够找到最优解。
在“反对”方面,然而,自底向上的方法甚至可能不是有效的,数学上或生理上。在数学方面,构建参数化模型自下而上分段的方式可以限制每个后来估计任务太多,最终产生错误的结论。即,如果从较小的模型获得的参数值并不完全适合较大的模型,解决方案空间会不适当的限制,可能不再包含正确的解决方案。在生物方面,即使正确的参数值获得了内在的增长速度,作为一个例子,物种之间的相互作用在更大的模型可能会改变一个或多个物种的生长特性(即有高阶相互作用)。此外,生态互动方面可能改变在价值或甚至登录三种模型。这些影响是一个问题,当高阶相互作用发生在几个物种。高阶相互作用的一个例子是在斑马鱼肠道微生物组实验表明,那里的研究人员表明,微生物物种的增加抑制了其他物种之间的相互作用对的优势,从而导致社区的稳定(Sundarraman et al ., 2020)。这一发现是否真正的一般来说是未知的。标准LV模型不具备直接处理这些类型的复杂相互作用,问题变成了如何LV模型,与其他模型,简化近似,还反映了现实,至少允许可靠的预测作用的迹象。
作为一个例子,我们再分析数据从早些时候提到的系统有四个物种(Piccardi et al ., 2019),但是使用不同的例子。图7显示的结果分析,我们推断的参数在四个不同的方面:
1。使用自顶向下方法没有先前的假设有关参数值,同时适合所有参数;
2。采用增长率从单一物种实验和拟合数据的所有交互参数四个物种实验;
3所示。从单一物种实验采用增长率和承载能力;和
4所示。使用每个单一物种的生长速度和承载能力试验,以及从生态相互作用参数的实验;在这种情况下,所有参数都因此被认为是已知的和四个物种数据只作为验证,因为没有参数被安装。
的结果图7强调几个问题,可能会或可能不会出现在各种评估策略。总的来说,很明显,减少过度拟合时一些参数是固定的。估计前不知情(所有参数自由;自顶向下)和固定增长率的估计,使参数估计,16/20生产,除了少数由算法试图将所有数据点的最小上交所。这是不太可能的动力学系统,尽管我们无法确定。正则化方法(上图)可能会抑制这些,除了少数。
图7。自顶向下的比较vs自底向上的方法。这里显示是增长的Ochrobactrum anthropi。时间是在小时丰度CFU /毫升对数刻度。点代表三个复制的颜色。的数据(Piccardi et al ., 2019)。
在另一个极端,只使用单一物种和生态参数值的估计,所以没有参数有待估计(所有固定;自底向上),高估了几乎所有时间点的密度,从而表明个别物种的生长和/或影响的一些互动的变化从生态系统过渡到合并后的四个物种系统。
在本例中,采用生长参数的估计(固定增长+承载能力)但离开自由交互参数估计显示良好的准确性和过度拟合之间的权衡(图7)。注意,这些适合不正规化。现在还不知道这个结果是否真的有一些共性。
我们也可以看看四个物种之间的相互作用方面的迹象(Piccardi et al ., 2019)是否合理类似当装有自底向上或自顶向下方法(图8)。令人不安的是,超过半数的交互信号交换,因此建议截然不同的物种之间的关系(见表1)。我们不知道真正的交互的细菌群落结构(Piccardi et al ., 2019),但有明显的迹象表明这两种方法会产生不同的结果。其原因可能是高阶相互作用发挥的大社区,与“新”物种影响其他物种之间的相互作用,即。的生态相互作用不能充分解释的框架。研究表明,更积极的交互发生在低多样性系统(帕默和培养,2022年成对作用),不能总是预测社区结果(弗里德曼et al ., 2017)。
图8。差异推断交互从自底向上的迹象(一)和自上而下的(B)适合数据从四个培养细菌物种(Piccardi et al ., 2019)。物种是(一)tumefacien(在),c . testosteroni(CT),米。saperdae(女士),o . anthropi(OA)。彩色积极的交互(蓝色)或负面(红色);cf。表1。80%的自底向上的交互系统和60%的自顶向下与作者的推断交互方向。没有检测到显著的直接影响为女士和OA,反之亦然(一);更确切的说,相应的交互非常接近于0。这也是OA在CT上的影响(B)。
从这个例子的总体结论是双重的:
1。谨慎是必要的,当采用子模型的参数值组合社区模型。没有保证底层参数值有效转化为更大的模型,因为交互参数可能改变其他物种的存在,从而导致高阶相互作用。没有进一步的实验,不可能辨别最有可能的交互结构。变成一个积极的观点,不同的分析表明,选择之间的相互作用可能持续评估和提出假设那些变量的交互作用在一个候选模型的合奏。
2。开始修复一些参数可能会给合理的拟合高维系统的初步估计,因为有人可能会认为早些时候参数值可能不是完全错误的,只是成为调制的物种。换句话说,它可能有利于通过低级参数值作为初始猜测的解决高级推理任务,可能与合理的范围。通过提供这些猜测,解算器可能更容易收敛于最优解,虽然没有保证。一旦获得这种解决方案,建议改变参数值在解决方案和重新评估系统中,为了解决方案是否或多或少是独特的或更大的整体的一部分。
某些方面的验证,我们可以看看模拟系统,我们知道坚持LV交互结构,定义“地面实况”,我们有一个用户定义的参数。表3表明这两个参数设置,从自底向上和自顶向下的估计,相比是相当好的地面真值参数。生态事实上,所有参数的自底向上的估计大致匹配时获得的参数估计所有四个物种在一起,至少在符号,并将,至少,提供良好的初始猜测随后梯度优化(见下文)。
搜索方法
如果所考虑的系统是线性时间序列数据是可用的,它通常是简单的估计最优参数值/多元线性回归(库特纳et al ., 2004)。这种方法同样是可行的,如果系统成为线性通过等价变换。值得注意的是,这对于LV系统是可能的,至少在适宜的条件下(我们和周,2010)。
接下来的三个部分描述的概念不同的参数估计方法所使用的专业搜索算法,重点是LV模型。这些算法是必需的,因为明确的数学解决方案不可能计算甚至对于中等大小的模型。相反,系统模拟非常多次与不同参数集和损失函数计算每一次。每个仿真取决于算法的设置,这样有一个合理的概率损失函数的值减少。通用参数搜索方法的介绍和评论包括(Gennemark Wedelin, 2007;周,我们2009;Gennemark Wedelin, 2009;我们2013)。
可用的类的算法选择新的参数集的方式不同。存在许多变化在每一个主题,我们这里关注的基本概念。
一个搜索估计的一般过程包括以下步骤:
1。进入模型结构的搜索算法的选择和选择一个损失函数。
2。基于系统的一般知识,选择一组初始的参数。最简单的选择由默认值提供的算法。然而,如果任何信息关于参数是已知的,使用这些信息可以大大加快算法。例如,它通常是已知的参数值是否必须是积极的还是消极的。通过输入这样的约束,搜索空间减少一半。
3所示。输入到模型和模拟的参数值。
4所示。计算损失函数的值。
5。让算法改变当前参数值。这一步让巨大的变化和每个方法的标志。
6。重复步骤3 - 5,直到找到一个优化的解决方案或一个预定义的限制的迭代次数。解决方案可能是实际的最优,但并不总是得到保证。例如,它可能是一个地方性质的,而是不是上交所的全局最小值。
无数的搜索算法,许多额外的变化,已经出版。都有优点和缺点,但仍然没有成功的银弹,可靠,有效地每次产量最优解。各种类型的算法可分为以下部分所示。
我们没有提到的可能性使用最大似然估计(标定)。尽管这种方法有效地减少了过度拟合的问题在统计应用程序(里德,2010),企业并不是真正有用的动态系统,大幅偏离从一个稳定状态,因为数据,从本质上说,不是独立同分布,这是一个大中型企业的先决条件。大中型企业的使用可能是有益的,然而,噪声的评估数据相对接近稳态(cf。(福尔摩斯et al ., 2012)。
大多数方法直接或一些coding-permit界限的设置为部分或全部参数估计。这样的界限是祝福也是一个问题。当然,强大的范围可以大幅减少搜索域的大小。同时,通常是已知的,例如,一个参数值是否应该积极的还是消极的。然而,边界的实现一个算法并不总是容易和可能需要特定的编码。
网格搜索
网格搜索是一个蛮力方法的测试每一个参数值的组合在一组预定义的范围内和预定义的密度。作为一个例子,考虑我们的单变量逻辑斯蒂方程。它包含两个参数,估计从数据需要建立一个二维网格表示的增长率α在x轴上,β在轴上。在生物应用中,我们知道α必须积极和β负的。因此,我们最初第四象限内设置的搜索区间,例如,
图9。物流模型的估计结果与网格搜索和五个梯度下降优化。参数域内的网格搜索([0,3],[3,0])一个和ß逻辑斯蒂方程。网格大小
在本例中所示,系统的网格搜索返回的参数值,我们知道,因为他们的结合完全坐落在一个网格点进行测试,但这通常不是这样的,例如,如果真正的值是不合理的。然而,即使真正的解决方案不躺在网格,搜索可以提供一个很好的估计的位置可以找到最优解。
大,相对粗网格搜索有时是一个很好的初始步骤确定局部最小值的近似位置,从而提供一个很好的起点更精致的类型的优化,包括可能细网格搜索最好的社区内的局部最小值在上一步中确定。这个过程中,迭代执行,很有可能导致参数集接近全球最低在预定义的范围内,网格尺寸的准确性。再一次,这个结果并不能保证,因为它在理论上是可能的,粗网格搜索本地最好的解决方案,即使真正的决定,全球解决方案是别的地方。
注意网格搜索两个参数可以很容易地执行和可视化,而块网格搜索变得不可行,其他参数和较小的离散化。例如,使用16自由参数和使用网格点Δ= 1的范围内(5,5)在每一个维度,它对应于只有11可能值为每个参数,我们必须创建一个解决方案的数组大小54·1112= 1.96·1015,使用浮点数(8个字节),需要分配超过15 pb级的内存。也需要非常长的时间来模拟每个参数的组合。推断解决方案*两个参数的情况下,解决所有组合需要除以211来解决,也就是说,近7000年!即便如此,这种方法只会给我们解决方案假设参数值是整数之间的5和5。面临着这样的“组合爆炸”,提出了很多方法来缓解这个问题。有关的例子包括拉丁超立方抽样和蒙特卡罗模拟(麦凯et al ., 1979;Luengo et al ., 2020),大的随机样本的参数值是在整个参数空间和解决方案进行了比较。这些都是很好的妥协否则却是不可行的问题,因为他们代表了搜索空间在一个可接受的时间内。这个方案的一个变体是重要性抽样,强调最有效的参数,因此选择更高的频率比其他参数(Luengo et al ., 2020)。
直接搜索方法
直接搜索方法包括很多变化的基本算法,从一个用户提供的初始估计的参数值,有时称为“推测”,本地搜索改进的参数设置和附近的移动搜索最大的改进的方向,也就是说,一个较低的价值损失函数。这个过程是迭代成千上万次。变化这一主题突出包括确定性和随机最陡下降和爬山的方法,牛顿和Levenberg-Marquardt方法和模拟退火。search-and-improve过程迭代,直至达到一个预定义的限制数量的模拟,直到没有更多的实质性的减少损失函数参数改变时,发现表明最低。这些和其他方法的详细介绍,看到(Kochenderfer和惠勒,2019年)。
最常见的直接搜索方法梯度下降法。一般,一个梯度下降优化器使用一组初始的参数{P0},与这些参数值,解决了模型计算的价值损失函数,通常SSE,接近这个函数的梯度在{P0}。然后,它改变了参数一套新的{P1},位于负方向的梯度,因此预计收益率较低的上交所。{的距离P0},{P1}由hyperparameter控制,学习速度。该算法解决了模型与集{P1},计算SSE,又决定了梯度。这个地方的过程改进是迭代数千倍。无数的变化基于梯度下降的方法在文献中均有描述。
原则上虽然一个非常有效的方法,这种方法容易陷入局部最小值,每个算法认为一个成功的结果,因为所有值附近的有更高SSE,尽管全球最低,可能很远,会有更低的上交所。有关更多信息,请参见第4章(格拉汉姆·古德费勒et al ., 2016)。
最近的技术设计,以避免这局部最小值的问题,例如,通过使用自适应学习速率和锦上添花的方法(钱,1999;Duchi et al ., 2011)。同时,重启与不同的参数估计可能有助于避免涉嫌在局部最小值的最优解。作为一个小问题,这些方法需要估计该模型是可微的,复杂的模型与方法不连续点没有衍生品;一个例子是
模拟退火是一种有效的算法,增加了一个重要的转折直接搜索算法:没有严格的可能性后,梯度局部最小值。的可能性进行到一个不同的方向是由参数决定的T。T代表温度,在冶金、引用退火这启发方法。这个方法很有效,但通常需要大量的计算(van Laarhoven和亚特,1987年)。
图9可视化的过程,基于梯度下降法的参数优化与之前相同的逻辑函数的例子。在这里,该算法将从五个不同的点在参数空间(初始猜测)。在这个简单的例子中,他们都收敛迅速的最小损失函数,使用正确的参数。这里使用的优化器是一个变种的亚当优化器(Kingma英航,2014),它使用一种自适应学习速率基于第一和第二时刻的梯度。
进化搜索方法
进化算法是全局搜索方法表面上从生物进化的原则,特点是随机突变和重组从一代到另一个。这些突变和重组导致性能优越,在这种情况下,较低的SSE,有更大的几率被传递给下一代。从根本上由一系列的进化算法一代又一代参数设置的改善随着时间的推移,(英航̈ck, 1996年)。他们主要包括遗传算法(Michalakelis et al ., 2012)、微分进化(Storn和价格,1997),蚁群(民宿和斯图̈tzle, 2004年)和粒子群优化(Mosayebi巴拉米,2018),但还别人。
这些类型的算法的一般步骤是:
1。选择——人口候选解决方案(参数设置)评估对一个损失函数;的适当的解决方案(最低的学生或其他损失函数值)给出概率最高的为下一代产生后代。人口规模可以由用户:人口规模的扩大提供更多的候选人的解决方案,但是需要更长的时间来计算解决方案。候选解决方案通过几种不同的方法可以选择,比如锦标赛选择、稳态选择或精英主义的选择(比和蒂埃尔,1996年)。它被证明是有利的选择概率,从而使一些不适应解决方案进入下一代,虽然低概率。
2。复合——这个关键过程,也称交叉上一代的父母,两个解决方案结合随机创建一个新的候选方案。具体地说,所有的参数值都按顺序排列成一个字符串,通常被称为一个染色体,第一部分的后代染色体来自父母中的一位,其余的从其他家长。截止是随机决定的。这些候选解决方案评估对他们的学生,和解决方案最低的父母和子女之间的党卫军将构成新一代的参数设置。这些细节取决于算法。大多数参数的变化出现在这一步的优化。
3所示。突变——一个非常小的概率,可以突变之前的候选人解决方案及新一代。这个选项是为了复制生物变异和维持人口的多样性。没有突变,候选解决方案可能会变得太相似,从不接近最优的解决方案。
通常这个三步过程结束后当解决方案不再提高一定数量的后代。另一个停止条件包括代的数量或时间限制。各种类型的进化算法使用不同的方法安排重组,引入突变。与梯度下降方法、进化方法不需要被调查系统是可微的。进化策略的更多信息,请参见(西蒙,2013)。
为了比较在后面一节中,我们将使用radius-limited微分进化实现(王et al ., 2014 a)。
作为一个例子,考虑一个进化的跟踪参数搜索逻辑函数的全局最小是(2.5,-2.0)(图10)。从(0,0)(第0代),解决方案快速跳转到(4.96,-2.59),一代一代2 (3.71,-2.82)。代三通过七找不到更好的解决方案比一代2中被发现。代八的解决方案适用于近200代直到找到一个解决方案在195年代相当接近真正的最低。解决方案是现在慢慢改善进一步解决方案在503年代(2.84,-2.28)。额外的小改进随之而来先后直到5314年一代,这是最后一代解决方案可以提高的地方,和算法终止的最终解决(2.502,-2.002),大概是正确的。
图10。的发展进化的优化。这个图使用相同的逻辑函数图9。(一)解决方案先后从第一个人口迁移的估计,参数集的最小SSE(4.96, -2.59),点左上角,集群的解决方案是调整在一代又一代1486 - 5314。真正的解决方案是在(2.5,-2.0)。(B)上交所改善在不同的步骤和收敛于约2.8·109在5314代。
注意进化方法不太可能找到精确的最小的损失函数,由于参数是随机生成的,和截止必须定义的标准,通常是一组数代或连续数代人没有解决方案的改进。事实上,一旦该算法停止,我们真的不知道该算法发现一个值接近真正的解决方案。但是每个人都应该注意,大多数现代算法通常做好避免局部最小值,基于的阿喀琉斯之踵梯度方法。因此,它通常是一个好的策略开始进化的算法,让它发展了一个良好的解决方案,然后将结果作为一个很好的起点直接搜索方法,如梯度法。
生态系统的代数推理方法
上述方法是直接适用于低压系统。然而,与此形成鲜明对比的是,直接和进化搜索方法,和许多其他方法由于其特定的结构,提出了一般或特定LV推理任务。在这里我们介绍两种方法:ALVI-LR由线性回归(代数LV推理)和ALVI-MI(矩阵求逆)。既可以作为独立的估计算法或作为工具来快速确定候选人解决方案随后调整基于梯度下降的方法。
ALVI-LR。一个n维LV系统
可以重新安排通过移动
如果时间序列数据的足够的数量和质量,
每个时间点
,大约相当小
一个更近似的平均斜率“三点公式”
数据呈指数变化的数量,而且可以估计斜坡的对数:因为
你可以执行的评估
斜率估计可以在进一步的信息(我们和阿尔梅达,2004)。应该注意的是,通常有利于平滑的数据,例如,平滑样条,计算斜坡从这个样条(见下文)。
总而言之,如果数据是可用的K时间点,他们可能被用来估计山坡上左边的情商。Mounier et al ., 2007)。在每个时间点并填充xj的右边,导致K每个变量的线性代数方程。随后使用线性回归x我计算
为便于推理任务的讨论,我们可能收集到的参数向量p,这取决于x我的,就是情商。Mounier et al ., 2007)。作为
用矩阵形式(
众所周知,在观测数据噪声加剧了在斜坡(诺尔斯和华莱士,1995)。这个问题可以通过平滑处理原始数据。例如,廖et al。有很好的成功拟合参数在使用经验模态分解(王et al ., 2014 b;廖et al ., 2020)。其他常见的平滑技术包括样条函数和黄土方法(克利夫兰,1979)。在平滑的更多信息见(Olivenca et al ., 2021)。一般来说,没有严格的标准指导的决定当平滑是必要或有益的。有点模糊的规则是平滑的数据如果示例中的信噪比太低,很难分辨出某些特性的数据,像山峰或过冲,在生理上合理或由于随机性。平滑还应该考虑如果斜坡时间趋势的估计,如果后续斜坡变化在大小的估计,特别是在信号。
平滑提供了其他重要的优点,除了减少离群值和噪声的影响。即,在平滑的趋势数据,的值x我和相应的斜坡可以估计任何点在报告时间间隔,从而增加执行回归的基础。此外,斜坡可以估计样条函数的代数。
有人可能会问:如果数据平滑,为什么估计一个LV模型甚至是必要的吗?答案是,平滑函数通常包含很多参数没有生物学上的意义。特别是,它们并没有透露任何关于人口之间的相互作用的本质在混合社区。
因此,一个有效的推理包含以下步骤:
1。平滑的数据,如果有必要;
2。估计的值x我的山坡上
3所示。选择一个损失函数;
4所示。最小化损失函数使用最小二乘回归,可能与规范化和正规化。
作为一个例子,考虑一个两变量系统和选择Δt = 1。第一个方程然后读取
数据集的时间11点(t= 0,…,10),we thus obtain a vector (B) of 11 slope estimates for speciesx1。利用斜率估计从上面,我们得到:
我们也制定一个数据矩阵(a)的值x1在不同的时间点:
在每个时间点的结果是B =⋅P。在这个配方,Δt融入的元素向量b。这种类型的方程建立了每个变量系统大型化。每个物种都有自己的独特的B矩阵,但所有物种的一个矩阵是相同的。矩阵有一个额外的列每个物种的1 s轨道。最优参数对应方程的解决方案设定⋅P-B = 0。由于噪声或平滑的趋势并不完全被LV方程,现在的任务是最小化AP-B函数,这是最容易最小二乘回归来完成。一旦所有参数值是推断,它们插入LV方程拟合优度评价。虽然我们没有使用界限可能的参数值,它们可能对部分或全部参数ALVI-LR评估任务。
ALVI-MI。前一节中已经证明为LV模型推理任务变得线性时间序列数据是否可用值x我和斜坡是估计。在上面,我们假设数据K时间点并通过线性回归得到解决方案。另一种是这样的。而不是使用价值K时间点,一个只使用n+ 1时间点。假设在这些点是线性无关的数据和斜坡,矩阵A和B导致线性方程组,可以解决简单的矩阵求逆。事实上,只有n+ 1的时间点是用于每个解决方案,带来了优点和缺点。一方面,最好的样本(s)需要确定。另一方面,保留所有结果ss自然生成一个整体较低的合身的模型。
作为一个例子,我们重温四个变量的模拟例子用下面的数据点,平均三个复制、叠加高斯噪声(5%表4)。
首先,我们选择n+ 1时间点。我们应该选择一个代表(广泛)样本,所以我们选择分1、2、3、8、9。我们可以用光滑的斜坡,黄土方法所示(Olivenca et al ., 2021),给出了矩阵不同值的数据点表4。这个步骤不是必要的方法来工作,但可能会稍微更好的推断。它导致下面的矩阵,在矩阵的数据和B我物种的向量我:
这里,每个斜坡除以∆t取样时间点之间。这是艾尔维软件自动完成(参见接下来的软件)。我们现在执行定期为每个B矩阵求逆和使用发票(A)⋅B获得系统的参数值。最好的结果通常是通过选择点捕获系统的动力学。党卫军最低的解决方案是保留和收集作为一个整体。图11和表5显示结果的集合九的党卫军最低的点集。其中,分2、3、5、6和9 SSE最低的生产解决方案。这些解决方案可能被丢弃,如果他们显示,或除了没有合理的基于生物(这里,集1、7和8)可能。有多少参数设置是包含在整体是一种选择的组ss和内碎屑生物判断。
图11。ALVI-MI模拟数据集的数据点符合噪音和复制。九种不同的组合(n + 1)时间点产生符合最低的党卫军显示真正的解决方案。总而言之,
表5。样本点集ALVI-MI推论和相应的SSE值数据图11。
分析可能的点的选择表明,类似SSE值不一定导致类似的适合。例如,最低的党卫军在上面的例子中得到组合6和7,这不过产生截然不同的趋势线。此外,小组7显示一个较大的超调在t = 1比面板6和一个额外的* 3和4之间的过度,这表明上交所声明时不应该是唯一的标准最合适。好符合标准的更多信息见(我们2011)。
从稳态数据LV估计参数
新变体艾尔维方法在前面的部分相互作用参数的估计从不同的稳态系统的概要文件。这些数据可能来自类似的实验导致了不同的结果。作为一个例子,抗生素的管理可能会导致不同的幸存者的细菌物种,即使所有实验的试验装置是相同的(巴尔加et al ., 2022)。在这项研究中,Meropenem导致管理的主导地位伯克cenocepacia或金黄色葡萄球菌,后者通常是无法生存在Meropenem的存在。即使没有抗生素,可以看到不同的结果在生物的复制新创数据集的大肠杆菌和金黄色葡萄球菌所示图3。即使在所有三个复制实验条件是相同的,实验端点出现的主导地位大肠杆菌或金黄色葡萄球菌。
图12。方法与模拟数据集。黑点代表物种的丰度X2在模拟数据集。四个曲线符合这些数据,获得不同的策略。注意ALVI-MI适合对应最好的一组点(6图11),而不是平均的合奏。(一)显示了一个解决方案/微分进化显然overfit大,阻尼振荡。(B)显示了一个微分进化,为所有参数纳入更严格的约束。适合所有其他方法在本质上是相同的两个面板,尽管他们在初始峰值不同,产生不同的党卫军(表6)。时间和数量单位是任意的。适合所有四个变量补充。
图13。比较参数推理Piccardi数据集的方法et al。(Piccardi et al ., 2019)。所示的物种是c . testosteroni。时间在小时丰富在对数刻度CFU /毫升。数据点是三个复制的物种。
表7。比较参数推理方法使用Piccardi的数据集et al。(Piccardi et al ., 2019)。这些值对应的适合图13。的损失函数,我们使用了SSE。时间不包括数据处理的解决方案。
数学上,这样一个系统的结构允许稳定稳定的几个州,盆地的吸引力被分隔号划定。在这种情况下,不同的结果是可能的如果两个社区的初始状态可能非常接近对方,但位于不同的分界线。因此,相同的模型,用完全相同的参数集,但从略微不同的物种在社区内的初始值,会导致截然不同的稳定状态,包括一个或多个物种灭绝。
理想情况下,如果系统涉及n物种,n + 1的幸存者概要文件将是可用的,因为那样将直接矩阵求逆,如下我们将演示。但即使数据稀少,一个富有成效的分析仍然是可能的,用附加信息或利用相关矩阵的伪逆(摩尔,1920;艾伯特,1972;彭罗斯,2008)。额外的信息,其他的实验可能会产生每个物种的生长特性,增长本身,在理想的情况下,已经取得了
作为一个例子,假设两个不同稳定状态的值可用于一个生态系统。在一个实验中,这两个物种共存,但在第二个实验中物种两不生存。具体而言,假设这两个稳态数据点是:
除以x12.5、插入一个1,并将在第一个稳态概要
同样第二稳态概要文件,我们获得
直接替换收益率(b11,b12)= -0.5 (2)。在更一般的符号,我们可以将方程转化为矩阵形式:
这可以解决矩阵求逆(或pseudo-inversion待定方程)。结果是
该方法适用于任意数量的物种的系统,如果充分配置文件可用许多不同的幸存者。如果少资料可用,方程组欠定的,包含正确的方法产生一个解决方案空间解决方案(我们et al ., 2021)。注意,这种方法假定不同的稳态配置文件存在即使物种非常相似条件下操作。配置文件可能反映了总共存或一个或多个物种的灭绝。如果找到不同的合身的参数设置为一个系统,可以建立一个整体的解决方案和统计参数可以用来确定最可能的参数设置(见图6,11)。
额外的通用方法以适应生态模型
由于流行的LV模型,研究社区开发了更多的方法比枚举到目前为止。一些例子如下:Michaliket al。使用增量单一射击策略来推断LV参数(Michalik et al ., 2009),而伯格曼et al。采用多重射击策略适合LV模型分段的方式(伯格曼et al ., 2016)。曹et al。提出了一种参数级联方法(曹et al ., 2007)。Waniewskyet al。使用一个基于单独的模型进行参数估计(Waniewski Jedruch, 1999)。温克et al。用高斯过程方法(温克et al ., 2020),而Martin-Fernandezet al。应用粒子滤波方法估计参数,同时测量生物量(Martin-Fernandez et al ., 2014)。肖et al。推断交互只使用稳态数据的快照使用蛮力和启发式算法(肖et al ., 2017)。
LV模型的参数估计为特定变异
简单的LV格式可以在无数的装饰方式。相应地,参数推理方法提出了许多具体情况。这里列出几个例子。摩et al。利用机械的见解建模的现象推断出交互以更有效的方式(摩et al ., 2017)。赵et al。参数化模型与跳跃(赵et al ., 2018)。斯坦et al。和大坝et al。介绍了季节性变化成一个LV模型(斯坦et al ., 2013;大坝et al ., 2016;大坝et al ., 2020)。齐默,Sahle可以参数化部分观察LV模型(齐默,2013)。最后,徐et al。介绍了布朗运动来模拟外部扰动(徐et al ., 2020)。
比较的方法应用于数据集
比较方法,我们使用相同的模拟four-variable数据集的上下文中,我们讨论了自顶向下和自底向上的评估。对于一个公平的比较,我们首先要确定每个场景的增长率和修复它们。1
这个场景中有一个完美的解决方案自参数从一个真正的生态系统。然而,没有一个方法发现的确切参数当所有20个参数允许可以没有约束,这表明密度不足的数据来推断的参数系统的信心。指出,动力学是用所有方法捕获,但周围的山峰t= 1在所有不同的解决方案。这个结果再一次表明,峰值的数据不包含足够的信息,以便SSE峰值的大小是不受影响的评估。对于这个系统,梯度下降方法发现的最适合对上交所以及最近的参数。然而,所有的方法都能够找到合理的估计,除了松约束的进化方法,这是overfit非常清楚。即使充分许多noise-less数据可用,推断参数估计可能不是100%准确,这可能是由于数值不准确,尤其是在斜坡上的时间趋势估计。它也是数学可能不同的参数设置可以产生完美的解决方案(我们2018)。
对于由Piccardi出版et al。(Piccardi et al ., 2019)和之前所讨论的,我们可以比较结果的某些方面作者的推断交互网络。作为他们的推断交互来自比较mono -和培养生长曲线下的面积,他们不能直接向我们的生态分析比较。但是,我们至少可以定性比较相互作用的迹象。尽管SSE最高,最匹配的线性回归方法的交互,论文的作者总结道。梯度搜索方法最低SSE下半年但介绍了一个过度的曲线。进化方法也产生了一些疙瘩,相对于线性algebra-based符合这一收益率相对平稳的趋势。指出一个代数方法需要计算的一小部分时间来寻找一个解决方案,尽管我们不包括数据预处理,平滑,在这个论点。更普遍的是,计算时间成为实质性的实用标准体重如果大型模型估计的任务目标,与几十个甚至几百个参数。它很可能失败的方法在这种情况下,即使他们表现良好的小模型。还应该提到的一些方法,包括这里提到的代数算法,比其他人更适合于加速解决方案时通过并行计算或使用多线程编程。 Thus, each method is a compromise, and it is impossible to declare winners and losers in a general manner.
讨论和结论
生态模型再次成为流行,这一次的环境中微生物群落往往决定人类和环境的健康。这些微生物的总体目标的识别和量化分析不同物种之间的相互作用,在LV捕获模型的交互参数。因此,这些参数的一个重要任务是推理从观测数据,无论是和震级迹象。最丰富的是时间序列数据,量化各种共存物种的丰度在一个时间点的序列。对于大多数动力学模型一样,这个量化通常是一个相当大的挑战。在这篇概述中,我们总结的典型步骤参数推理过程,尤其着重于LV模型。这些模型脱颖而出,由于他们的历史成功的应用程序和事实推断LV的任务参数时间序列数据可以转化为线性问题(我们和周,2010)。不可能制定一个严格的正式测试来确定一个LV模型的准确性为特定社区系统,但大量的工作在文献中已经解决充分性方面的实验应用程序(如。,(Dedrick et al ., 2022)),这些方程的计算能力为各种不同的分析(如。,(我们et al ., 2021))。
之前调用了特定的推理算法,它有利于预处理数据通过数据清洗、平滑、斜坡的估计,可以大大减少计算时间在大型和中等大系统。事实上,计算工作量的分析表明,在95%的时间里使用一个搜索引擎来确定最优的参数值赋系统是用于集成这些方程,这一步可以规避如果斜坡可以估计(我们和阿尔梅达,2004)。也是明智的考虑不同的度量产生的数据质量符合参数推理。
推理过程本身,我们已经讨论了通用和专业方法和应用合成和真实的数据集。分析不同的例子证明每个方法在这方面擅长,它有缺点。网格搜索只是很小的可行的系统,虽然这一概念可以扩展更大的系统通过专门的统计抽样或蒙特卡罗模拟。后者可能有用得到的印象在整个参数空间的解决方案,但他们很少披露可靠的定量的解决方案。典型的梯度方法调整了许多年。他们一直,永远是参数估计的真实工作马但耗时和容易收敛于局部极小值。进化方法对全球领先搜索的潜力评估任务的最小但很少产生确切的答案。因此几乎成为标准程序启动参数搜索进化方法并遵循它梯度法。我们还讨论了两种新的代数LV推理(艾尔维)方法是基于线性代数。他们的理论基础是先前记录的小et al。(肖et al ., 2017详细)和实际应用不同的数据集(Olivenca et al ., 2021)。这些方法并不总是捕捉瞬态动力学以及梯度方法,这可能是由于不精确估计斜坡时,但避免过度拟合和计算如此便宜以至于许多适合很容易计算,要么选择最低的解决方案的价值损失函数或建立整个合奏的合身的解决方案。
一个公正的所有方法的总体比较是困难的,因为不同的指标应考虑真正无与伦比的(表8)。这些指标包括残留误差,计算时间,多个解决方案和解决方案领域,似乎不切实际的动力学参数值,生物表示怀疑。因此,它可能是可取的干净和平稳的数据,估计斜坡,艾尔维开始。在许多情况下,这个过程会产生良好的解决方案,但它也可以作为一种快速的方法生成初始猜测更精致的好方法。
最后,无数的方法是可用的,但仍然没有银弹,和参数估计还有待的一种艺术。在某种程度上,这是因为计算机技术还没有普遍有效,所有方法可以夸耀的例子闪闪发光。然而,这些方法的支持者也承认算法变得非常缓慢的情况下,完全无效,或失败。
结合理论和计算问题是“马虎”或“不可辨识的参数估计任务(如。,(阿金et al ., 2007;Raue et al ., 2009;Vilela et al ., 2009;Srinath谷纳温,2010))。即,它是一个频繁发生,甚至相似或非常不同的参数集生产ss的类似的质量。原因通常是两种情况:第一,模型可能允许精确或近似冗余在其参数,如两个参数,总是发生在模型作为一个产品p1·p2,在这种情况下,产品可能估计,但的任意组合p1和p2导致同样的产品产量不同,但同样很好的解决方案。这种特殊情况下几乎是微不足道的,但这种冗余是相当频繁的在实际系统(如。,(高尔et al ., 2008;我们2018))。第二,模型的结构是这样,许多参数设置产生相似,虽然不是相同的符合。这种情况可以麻烦,因为一个“最佳”参数设置为给定的数据集可能会失败彻底如果相同的参数用于模型的另一个数据集。积极的解释这种情况会导致多个解决方案的验收和总体效果的识别模型,当我们讨论它们的文本。
参数值的估计不仅是数学任务但有生物的影响(我们2011)。可能发生一个参数的拟解决方案有一个不合理的甚至错误的信号级生物的理由,例如,消极虽然代表了离职率。最后,给出的相对最佳参数集数据可能掩盖了一个事实:模型结构是不足够的,这成为一个严重的问题,当模型外推对新的生物情况或数据。作为一个例子,我们估计Piccardi数据和我们的数据产生不错的适合,但这并不证明LV框架是最好的选择。更复杂的模型,如广义质量作用系统(我们2013)直接扩展LV系统,可以提供更好的适合,例如,通过允许高阶相互作用的物种。这些适合较低的学生可能会需要更多的参数,提高困难的问题增加模型的复杂性是否“值得”。
所有这些挑战可能会让人望而生畏,但至少他们中的许多人已经被认同和接受科学审查,虽然他们并不一定解决。但这种努力是肯定的。毕竟,估计参数值的理论模型和生物之间的实际的现实世界。
软件
模拟和优化任务执行在茱莉亚的编程语言(v1.7) (Bezanson et al ., 2017)。结果可视化ggplot2包(v.3.3.6) R (v4.1.3)编程语言或Javascript版本的策划方案(v2.14.0) (韦翰,2016;西韦特,2020)。网络可视化处理Cytoscape (v3.9.1) (香农et al ., 2003)。
微分方程是解决了使用不同变体的龙格-库塔(Tsitouras 2011;奈克考卡斯和聂,2017)方法,根据需要解决的问题的类型。模拟被处决的茱莉亚编程语言(Bezanson et al ., 2017)。
网格搜索方法:每个参数在一个预定义的范围(0-five评估
基于梯度下降的方法:参数调谐使用AdaMax (Kingma英航,2014)方法的学习速率1 e - 3 0作为初始参数使用流量优化的包(v0.13.4) (英纳斯,2018)。
微分进化方法:参数调优5到5的范围
ALVI-LR方法:数据是离散的(Mounier et al ., 2007),分为一个向量的丰度和估计的斜坡。每个变量进行优化单独使用一个内部点优化解算器(Biegler Zavala, 2009在跳包(1.1.1)(邓宁et al ., 2017)。与黄土进行平滑方法中描述(Olivenca et al ., 2021)。
ALVI-MI方法进行描述(Olivenca et al ., 2021)。
艾尔维幸存者概要文件方法中描述执行(我们et al ., 2021)。
作者的贡献
某人,JD,和电动汽车。这个项目构思并进行文献综述。JD创建合成数据的例子,执行分析,写的手稿。做了分析,并研究所需的代码。所有作者审查和编辑的手稿。
资金
作者承认以下这个项目资金来源支持:囊性纤维化基金会(BROWN19I0, BROWN21P0 DAVIS21H0)、疾病控制和预防中心(BAA 2016 - n - 17812, BAA 2017 -全尺寸- 01,75 d30120c - 09782),美国国立卫生研究院(1 r21ai143296和1 r21ai156817)和乔治亚研究联盟。
确认
作者还想承认我们的成员和棕色的手稿,实验室的价值贡献和伙伴关系先进计算(速度)乔治亚理工大学的计算节点使用。
的利益冲突
作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。
出版商的注意
本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。
补充材料
本文的补充材料在网上可以找到:https://www.雷竞技rebatfrontiersin.org/articles/10.3389/fsysb.2022.1021897/full补充材料。
脚注
1注意,一个完整的网格搜索甚至不可行问题的大小。
引用
Allesina, S。,T一个ng, S. (2012). Stability criteria for complex ecosystems.自然483 (7388),205 - 208。doi: 10.1038 / nature10832
阿金,a P。,Gutenkunst, R. N., Waterfall, J. J., Casey, F. P., Brown, K. S., Myers, C. R., et al. (2007). Universally sloppy parameter sensitivities in systems biology models.公共科学图书馆第一版。医学杂志。3 (10)1871 - 1878。doi: 10.1371 / journal.pcbi.0030189
伯格曼,f . T。、Sahle年代。,Zimmer, C. (2016). Piecewise parameter estimation for stochastic models in COPASI.生物信息学32 (10),1586 - 1588。doi: 10.1093 /生物信息学/ btv759
Bezanson, J。,Edelman, A., Karpinski, S., and Shah, V. B. (2017). Julia: A fresh approach to numerical computing.暹罗启Soc。印第安纳州,达成。数学。59 (1),65 - 98。doi: 10.1137 / 141000671
Biegler, l . T。,Zavala, V. M. (2009). Large-scale nonlinear programming using IPOPT: An integrating framework for enterprise-wide dynamic optimization.第一版。化学。Eng。33 (3),575 - 582。doi: 10.1016 / j.compchemeng.2008.08.006
比,T。,Thiele, L. (1996). A comparison of selection schemes used in evolutionary algorithms.另一个星球。第一版。4 (4),361 - 394。doi: 10.1162 / evco.1996.4.4.361
Boulineau, S。,To年代tev我n,F., Kiviet, D. J., ten Wolde, P. R., Nghe, P., and Tans, S. J. (2013). Single-Cell dynamics reveals sustained growth during diauxic shifts.《公共科学图书馆•综合》8 (4),e61686。doi: 10.1371 / journal.pone.0061686
Buffie, c·G。Bucci, V。,Stein R R。,米cKenney,P。T., Ling, L., Gobourne, A., et al. (2015). Precision microbiome reconstitution restores bile acid mediated resistance to艰难梭状芽胞杆菌。自然517 (7533),205 - 208。doi: 10.1038 / nature13828
曹,J。,Fussmann, G. F., and Ramsay, J. O. (2007). Estimating a predator‐prey dynamical model with the parameter cascades method.生物识别技术64 (3),959 - 967。doi: 10.1111 / j.1541-0420.2007.00942.x
卡塞拉,G。Ghosh, M。吉尔,J。,Kyung, M. (2010). Penalized regression, standard errors, and Bayesian lassos.贝叶斯肛门。5 (2)。doi: 10.1214 / 10-ba607
蒋介石,s y (2012)。生态模型的一个应用程序对台湾从200毫米到300毫米硅晶圆。抛光工艺。预测。Soc。改变79 (2),383 - 392。doi: 10.1016 / j.techfore.2011.05.007
崔,k . H。,Gaynor, J. B., White, K. G., Lopez, C., Bosio, C. M., Karkhoff-Schweizer, R. R., et al. (2005). A Tn7-based broad-range bacterial cloning and expression system.Nat方法。2 (6),443 - 448。doi: 10.1038 / nmeth765
周,即C。,我们,e . O。(2009)。最近的事态发展在参数估计和结构识别的生化和基因系统。数学。Biosci。219 (2),57 - 83。doi: 10.1016 / j.mbs.2009.03.002
Dakos, V。,Joseph, T. A., Shenhav, L., Xavier, J. B., Halperin, E., and Pe’er, I. (2020). Compositional Lotka-Volterra describes microbial dynamics in the simplex.公共科学图书馆第一版。医学杂志。16 (5),e1007917。doi: 10.1371 / journal.pcbi.1007917
大坝,P。,Fonseca, L. L., Konstantinidis, K. T., and Voit, E. O. (2016). Dynamic models of the complex microbial metapopulation of lake mendota.NPJ系统。医学杂志。达成。2、16007。doi: 10.1038 / npjsba.2016.7
大坝,P。,Rodr我guez, R. L., Luo, C., Hatt, J., Tsementzi, D., Konstantinidis, K. T., et al. (2020). Model-based comparisons of the abundance dynamics of bacterial communities in two lakes.科学。代表。10 (1),2423。doi: 10.1038 / s41598 - 020 - 58769 - y
戴维斯,J。,Olivenca, D., Brown, S., and Voit, E. (2022). A passaged 3-species synthetic microbial community.Zenodo。
掩盖的年代。,Warrier, V., Lemon, K. P., and Momeni, B. (2022). When does a lotka-volterra model represent microbial interactions? Insights from体外鼻腔细菌社区。bioRxiv。
迪马斯马丁斯,。,Gjini, E. (2020). Modeling competitive mixtures with the lotka-volterra framework for more complex fitness assessment between strains.前面。Microbiol。11日,572487年。doi: 10.3389 / fmicb.2020.572487
Duchi, J。,Hazan, E., and Singer, Y. (2011). Adaptive subgradient methods for online learning and stochastic optimization.j·马赫。学习Res。12日,2121 - 2159。
邓宁,我。,Huchette, J., and Lubin, M. (2017). JuMP: A modeling language for mathematical optimization.暹罗启Soc。印第安纳州,达成。数学。59 (2),295 - 320。m1020575 doi: 10.1137/15
弗里德曼,J。,Higgins, L. M., and Gore, J. (2017). Community structure follows simple assembly rules in microbial microcosms.Nat,生态。另一个星球。1(5),109年。doi: 10.1038 / s41559 - 017 - 0109
Gennemark, P。,Wedelin, D. (2009). Benchmarks for identification of ordinary differential equations from time series data.生物信息学25 (6),780 - 786。doi: 10.1093 /生物信息学/ btp050
Gennemark, P。,Wedelin, D. (2007). Efficient algorithms for ordinary differential equation model identification of biological systems.专业系统。医学杂志。1 (2),120 - 129。doi: 10.1049 / iet-syb: 20050098
Golub g . H。希斯,M。,Wahba, G. (1979). Generalized cross-validation as a method for choosing a good ridge parameter.技术计量学21 (2)215 - 223。doi: 10.1080 / 00401706.1979.10489751
格雷沙姆,D。,Dunham, M. J. (2014). The enduring utility of continuous culturing in experimental evolution.基因组学104 (6),399 - 405。doi: 10.1016 / j.ygeno.2014.09.015
Hacinliyan, a S。Kusbeyzi,我。,一个yb一个r,O. O. (2010). Approximate solutions of Maxwell Bloch equations and possible Lotka Volterra type behavior.非线性动力学。62 (1 - 2),17-26。doi: 10.1007 / s11071 - 010 - 9695 - 5
汉森,p . C。,O’Leary, D. P. (1993). The use of the L-curve in the regularization of discrete ill-posed problems.暹罗j .科学。第一版。14 (6),1487 - 1503。doi: 10.1137 / 0914086
Hasdemir D。,Hoefsloot, H. C. J., and Smilde, A. K. (2015). Validation and selection of ODE based systems biology models: How to arrive at more reliable decisions.BMC系统。医学杂志。9 (1)32。doi: 10.1186 / s12918 - 015 - 0180 - 0
Hernandez-Bermejo B。,Fairen, V. (1997). Lotka-volterra representation of general nonlinear systems.数学。Biosci。140(1),学会年会。doi: 10.1016 / s0025 - 5564 (96) 00131 - 9
福尔摩斯,E·E。病房,e . J。,Wills, K. (2012). Marss: Multivariate autoregressive state-space models for analyzing time-series data.R J。4 (1)11。doi: 10.32614 / rj - 2012 - 002
豪氏威马,J。,Weissing, F. J. (1999). Biodiversity of plankton by species oscillations and chaos.自然402 (6760),407 - 410。doi: 10.1038/46540
Ibberson, c, B。Parlet, c·P。,Kwiecinski, J., Crosby, H. A., Meyerholz, D. K., Horswill, A. R., et al. (2016). Hyaluronan modulation impacts金黄色葡萄球菌生物膜感染。感染。Immun。84 (6),1917 - 1929。doi: 10.1128 / IAI.01418-15
Kargi, f (2009)。演绎逻辑斯蒂方程的批处理微生物的生长与莫诺动力学。列托人。达成。Microbiol。48 (4),398 - 401。doi: 10.1111 / j.1472 - 765 x.2008.02537.x
Kingma, d . P。,B一个,J. (2014). Adam: A method for stochastic optimization. 2014 December 01, 2014:[arXiv:1412.6980 p.]. Available at:https://ui.adsabs.harvard.edu/abs/2014arXiv1412.6980K。
诺尔斯,我。,Wallace, R. (1995). A variational method for numerical differentiation.号码。数学。70 (1),91 - 110。doi: 10.1007 / s002110050111
Kuepfer, L。,彼得,M。,萨奥尔,U。,年代tell我ng, J. (2007). Ensemble modeling for analysis of cell signaling dynamics.生物科技Nat。》。25 (9),1001 - 1006。doi: 10.1038 / nbt1330
李,Y。,Lafontaine Rivera, J. G., and Liao, J. C. (2014). Ensemble Modeling for Robustness Analysis in engineering non-native metabolic pathways.金属底座。Eng。25日,63 - 71。doi: 10.1016 / j.ymben.2014.06.006
廖,C。,X一个v我er,J. B., and Zhu, Z. (2020). Enhanced inference of ecological networks by parameterizing ensembles of population dynamics models constrained with prior knowledge.BMC生态。20 (1),3。doi: 10.1186 / s12898 - 019 - 0272 - 6
Luengo D。,米一个rt我no,L., Bugallo, M., Elvira, V., and Sarkka, S. (2020). A survey of Monte Carlo methods for parameter estimation.EURASIP j .放置信号的过程。2020 (1),25。doi: 10.1186 / s13634 - 020 - 00675 - 6
Martin-Fernandez, L。Gilioli, G。,Lanzarone, E., Míguez, J., Pasquali, S., Ruggeri, F., et al. (2014). A Rao-Blackwellized particle filter for joint parameter estimation and biomass tracking in a stochastic predator-prey system.数学。Biosci。Eng。11 (3),573 - 597。doi: 10.3934 / mbe.2014.11.573
梅纳德·d·S。,米我ller,Z. R., and Allesina, S. (2020). Predicting coexistence in experimental ecological communities.Nat,生态。另一个星球。4 (1),91 - 100。doi: 10.1038 / s41559 - 019 - 1059 - z
麦凯,m D。,Beck米一个n,R。J., and Conover, W. J. (1979). A comparison of three methods for selecting values of input variables in the analysis of output from a computer code.技术计量学21 (2)239 - 245。doi: 10.2307 / 1268522
麦克纳利,L。,Bern一个rdy,E., Thomas, J., Kalziqi, A., Pentz, J., Brown, S. P., et al. (2017). Killing by Type VI secretion drives genetic phase separation and correlates with increased cooperation.Commun Nat。8,14371。doi: 10.1038 / ncomms14371
Michalakelis C。,Christodoulos, C., Varoutas, D., and Sphicopoulos, T. (2012). Dynamic estimation of markets exhibiting a prey–predator behavior.专家系统。达成。39 (9),7690 - 7700。doi: 10.1016 / j.eswa.2012.01.049
Michalik C。,Hannemann, R., and Marquardt, W. (2009). Incremental single shooting—a robust method for the estimation of parameters in dynamical systems.第一版。化学。Eng。33 (7),1298 - 1305。doi: 10.1016 / j.compchemeng.2009.02.002
摩,B。谢,L。,年代hou, W. (2017). Lotka-Volterra pairwise modeling fails to capture diverse pairwise microbial interactions.Elife6,e25051。doi: 10.7554 / eLife.25051
Mosayebi, R。,B一个hrami, F. (2018). A modified particle swarm optimization algorithm for parameter estimation of a biological system.定理。医学杂志。地中海。模型。15(1),17岁。doi: 10.1186 / s12976 - 018 - 0089 - 6
Mounier, J。,米onnet,C., Vallaeys, T., Arditi, R., Sarthou, A. S., Helias, A., et al. (2007). Microbial interactions within a cheese microbial community.达成。环绕。Microbiol。74 (1),172 - 181。doi: 10.1128 / AEM.01338-07
Muhlbauer l·K。Schulze, M。,Harpole, W. S., and Clark, A. T. (2020). gauseR: Simple methods for fitting Lotka-Volterra models describing Gause's "Struggle for Existence.生态。另一个星球。10 (23),13275 - 13283。doi: 10.1002 / ece3.6926
Muloiwa, M。,Nyende-Byakika, S., and Dinka, M. (2020). Comparison of unstructured kinetic bacterial growth models.南误判率。j .化学。Eng。33岁,141 - 150。doi: 10.1016 / j.sajce.2020.07.006
纳瓦罗Llorens, j . M。Tormo,。,米一个rtínez-García, E. (2010). Stationary phase in gram-negative bacteria.《。牧师。34 (4),476 - 495。doi: 10.1111 / j.1574-6976.2010.00213.x
Neumaier, a (1998)。解决坏心肠的奇异线性系统:正规化的教程。暹罗启Soc。印第安纳州,达成。数学。40 (3),636 - 666。doi: 10.1137 / s0036144597321909
帕默,j . D。,Foster, K. R. (2022). Bacterial species rarely work together.科学376 (6593),581 - 582。doi: 10.1126 / science.abn5093
Piccardi, P。,Vessman, B., and Mitri, S. (2019). Toxicity drives facilitation between 4 bacterial species.Proc。国家的。学会科学。美国的一个。116 (32),15979 - 15984。doi: 10.1073 / pnas.1906172116
奈克考卡斯,C。,Nie, Q. (2017). DifferentialEquations.jl – a performant and feature-rich ecosystem for solving differential equations in Julia.j .打开Softw》。5、15。doi: 10.5334 / jors.151
Rattray, j·B。,Thomas, S. A., Wang, Y., Molotkova, E., Gurney, J., Varga, J. J., et al. (2022). Bacterial quorum sensing allows graded and bimodal cellular responses to variations in population density.mBio13 (3),e0074522。doi: 10.1128 / mbio.00745-22
Raue,。,Kreutz, C., Maiwald, T., Bachmann, J., Schilling, M., Klingmüller, U., et al. (2009). Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood.生物信息学25 (15),1923 - 1929。doi: 10.1093 /生物信息学/ btp358
Rousseeuw, p . J。,Hubert, M. (2011). Robust statistics for outlier detection.线数据分钟。知识。越是加大。1 (1),73 - 79。doi: 10.1002 / widm.2
香农,P。,米一个rk我el,一个。Ozier, O。,B一个liga, N. S., Wang, J. T., Ramage, D., et al. (2003). Cytoscape: A software environment for integrated models of biomolecular interaction networks.基因组Res。13 (11),2498 - 2504。doi: 10.1101 / gr.1239303
Sprott, j . C。Vano, j。,Wildenberg, J. C., Anderson, M. B., and Noel, J. K. (2005). Coexistence and chaos in complex ecologies.理论物理。列托人。一个335 (2 - 3),207 - 212。doi: 10.1016 / j.physleta.2004.12.068
Srinath, S。,Gunawan, R. (2010). Parameter identifiability of power-law biochemical system models.生物科技j .》。149 (3),132 - 140。doi: 10.1016 / j.jbiotec.2010.02.019
Stein R R。Bucci, V。,Tou年代年代一个我nt,N. C., Buffie, C. G., Ratsch, G., Pamer, E. G., et al. (2013). Ecological modeling from time-series inference: Insight into dynamics and stability of intestinal microbiota.公共科学图书馆第一版。医学杂志。9 (12),e1003388。doi: 10.1371 / journal.pcbi.1003388
Storn, R。,Pr我ce,K。(1997). Differential evolution – a simple and efficient heuristic for global optimization over continuous spaces.j .水珠。Optim。11 (4),341 - 359。doi: 10.1023 /: 1008202821328
Sundarraman D。干草,大肠。,米一个rt我n年代,D. M., Shields, D. S., Pettinari, N. L., and Parthasarathy, R. (2020). Higher-order interactions dampen pairwise competition in the zebrafish gut microbiome.mBio11(5),016677年。doi: 10.1128 / mBio.01667-20
Tsitouras, c (2011)。龙格-库塔双订单5(4)只满足第一列简化假设。第一版。数学。达成。62 (2),770 - 775。doi: 10.1016 / j.camwa.2011.06.002
Van den Broeck, J。,一个rgeseanu Cunningham, S., Eeckels, R., and Herbst, K. (2005). Data cleaning: Detecting, diagnosing, and editing data abnormalities.科学硕士。2 (10),e267。doi: 10.1371 / journal.pmed.0020267
Vano, j . A。,Wildenberg, J. C., Anderson, M. B., Noel, J. K., and Sprott, J. C. (2006). Chaos in low-dimensional Lotka-Volterra models of competition.非线性19 (10),2391 - 2404。0951 - 7715/19/10/006 doi: 10.1088 /
巴尔加,J·J。,赵,C. Y., Davis, J. D., Hao, Y., Farrell, J. M., Gurney, J. R., et al. (2022). Antibiotics drive expansion of rare pathogens in a chronic infection microbiome model.mSphere。
Venturelli, o年代。卡尔,a . C。费舍尔,G。许,r . H。刘,R。,Bowen, B. P., et al. (2018). Deciphering microbial interactions in synthetic human gut microbiome communities.摩尔。系统。医学杂志。14 (6),e8157。doi: 10.15252 / msb.20178157
Vilela, M。,Vinga, S., Maia, M. A. G. M., Voit, E. O., and Almeida, J. S. (2009). Identification of neutral biochemical network models from time series data.BMC系统。医学杂志。3(1),47岁。doi: 10.1186 / 1752-0509-3-47
我们,e . O。,一个l米e我d一个,J. (2004). Decoupling dynamical systems for pathway identification from metabolic profiles.生物信息学20 (11),1670 - 1681。doi: 10.1093 /生物信息学/ bth140
我们,e . O。,戴维斯,J。D., and Olivença, D. V. (2021). Inference and validation of the structure of lotka-volterra models.bioRxiv。doi: 10.1101 / 2021.08.14.456346
我们,e . O。,年代一个v一个geau, M. A. (1986). Equivalence between S-systems and volterra systems.数学。Biosci。78 (1),47-55。0025 - 5564 . doi: 10.1016 / (86) 90030 - 1
我们,e . O。,年代一个v一个geau, M. A. (1982). Power-law approach to modeling biological systems; II. Application to ethanol production.j .发酵。抛光工艺。229 - 232。
王,Y。,Li, H. X., Huang, T. W., and Li, L. (2014). Differential evolution based on covariance matrix learning and bimodal distribution parameter setting.达成。柔软的第一版。18日,232 - 247。doi: 10.1016 / j.asoc.2014.01.038
王,y . H。,Yeh, C. H., Young, H. W. V., Hu, K., and Lo, M. T. (2014). On the computational complexity of the empirical mode decomposition algorithm.理论物理。Stat。机械。它的达成。400年,159 - 167。doi: 10.1016 / j.physa.2014.01.020
Waniewski, J。,Jedruch, W. (1999). Individual based modeling and parameter estimation for a Lotka–Volterra system.数学。Biosci。157 (1 - 2),23-36。doi: 10.1016 / s0025 - 5564 (98) 10075 - 5
温克,P。,一个bb在我,G., Osborne, M. A., Schölkopf, B., Krause, A., and Bauer, S. (2020). ODIN: ODE-informed regression for parameter and state inference in time-continuous dynamical systems.Proc。AAAI相依Artif。智能。34 (04)6364 - 6371。doi: 10.1609 / aaai.v34i04.6106
肖,Y。,一个gulo, M. T., Friedman, J., Waldor, M. K., Weiss, S. T., and Liu, Y. Y. (2017). Mapping the ecological networks of microbial communities.Commun Nat。8 (1),2042。doi: 10.1038 / s41467 - 017 - 02090 - 2
徐,L。,Xu,X。香港,D。顾,H。,Kenney, T. (2020). Stochastic generalized lotka-volterra model with an application to learning microbial community structures. 2020 September 01, 2020:[arXiv:2009.10922 p.]. Available at:https://ui.adsabs.harvard.edu/abs/2020arXiv200910922X。
赵,H。,Zhang, C., and Wen, L. (2018). Maximum likelihood estimation for stochastic Lotka–Volterra model with jumps.放置不同。装备的。2018 (1),148。doi: 10.1186 / s13662 - 018 - 1605 - z
周,Y。,Chen, B. (2006). “Analysis of multi-ISPs game based on lotka-volterra model,” in2006年国际会议上计算智力模型控制和自动化和智能代理Web技术国际会议和国际商务(CIMCA 06年)34岁。
邹,H。,Hastie, T。(2005)。通过弹性净正规化和变量选择。j . r . Stat。Soc。B67年,301 - 320。doi: 10.1111 / j.1467-9868.2005.00503.x
关键词:社区动态,生态模型、微生物、参数估计、种群动态、系统生物学
引用:戴维斯JD, Olivenca DV,布朗SP和我们光电(2022)的方法量化人口使用生态模型之间的交互。前面。系统。医学杂志。2:1021897。doi: 10.3389 / fsysb.2022.1021897
收到:2022年8月17日;接受:2022年10月04;
发表:2022年10月26日。
编辑:
Rongling吴宾夕法尼亚州立大学(事业单位),美国版权©2022年戴维斯Olivenca,布朗和我们。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。
*通信:埃伯哈德o .我们eberhard.voit@bme.gatech.edu