跳转到主要内容

原始研究的文章

前面。性研究。,23February 2023
秒。病毒多样化和演化
卷3 - 2023 | https://doi.org/10.3389/fviro.2023.1066147

检测不时进化SARS-CoV-2在第一年的大流行

  • 1蒙大拿州立大学数学科学系的,勃兹曼,美国太
  • 2大学生物科学学院的阅读,阅读,联合王国

严重急性呼吸系统综合症冠状病毒2 (SARS-CoV-2)进化缓慢的第一年19 (COVID-19)冠状病毒病流行与微分在血统变异率。在这里,我们探讨这种变化出现。是否进化中逐渐积累在血统或病毒谱系分支还不清楚。使用系统发育回归模型,我们表明,2020年5 ~ 13%的SARS-CoV-2基因组差异归因于谱系分支事件(进化)。沿着谱系分支事件预测的净数量~ 5%的偏离严格的分子钟。我们没有检测不时在SARS-CoV-1进化,可能由于小样本大小,在sarbecovirus广泛,可能由于一个完全不同的进化过程。标点符号在SARS-CoV-2可能是中立的,因为大多数突变是不积极选择,因为punctuational效应的强度随时间保持不变,至少直到2020年5月,跨洲。然而,小punctuational贡献SARS-CoV-2多样性符合创始人效应引起的狭窄的传输瓶颈。因此,SARS-CoV-2标点符号可能代表宏观进化论后果(率变化)microevolutionary过程(传输瓶颈)。

1介绍

截至2022年10月,SARS-CoV-2已经感染了~ 6.21亿人,死亡~ 660万全球(1)。SARS-CoV-2迅速传播,但它在第一年缓慢突变的大流行,每月大约两个突变(2)。虽然慢,但进化速率不同血统(2)。2020年底率变化变得更加明显,当出现变异的担忧”,如α/ B.1.1.7(英国),β/ B.1.351(南非),伽马/ P。1(巴西),δ/ B.1.617.2(印度),和买卖/ B.1.1.529(多个国家)(3)。由多组变异,这些变异有可能逃脱中和(4,5)。

推断SARS-CoV-2进化速率(节奏)解释的关键病毒多样性和通知缓解措施,包括疫苗开发(6)。建模速度变化是病毒性phylodynamics(基本7,8)。例如,血统B.1.1.7经历了14个氨基酸替换在单个分支,可能由于慢性感染(4,9)。这个罕见的,单个的分支速度加速度是类似于病毒抗原性的标点符号(10- - - - - -12)。

SARS-CoV-2可能稳步积累突变,独立于lineage-branching事件(零假设:渐进进化)(13)。内逐渐演变和血统的速度取决于因素,如基因组结构,复制率和聚合酶富达(14)。相比之下,SARS-CoV-2可能已经积累了更多的突变在家族分裂或多样化,一般是病毒感染新的宿主(备择假设:不时进化)。这里,打断分子进化是一个不太严格的版本的著名的间断平衡理论(15),它认为,在地质时间,进化停滞在物种形成事件的变化。所不同的是,在分子水平上标点符号不需要停滞,只是一个进化速率和物种形成之间的联系(16)。

可能出现间断进化通过漂移或选择(16)。主机到主机传输与狭窄的人口瓶颈(17,18),类似于恩斯特·迈尔的物种形成模式的奠基者效应(19)。小成立人口遗传漂变,因此,快速进化。另外,标点符号也可以造成正面或多元化选择与进入新环境(15,16)或新的SARS-CoV-2人类宿主。无论机制,快速进化在传输过程中可能产生的长期影响。我们预计SARS-CoV-2血统,经历更多的分支进化事件。的净数量lineage-branching事件可能预测,部分偏离严格的分子钟(13)。如果是这样,SARS-CoV-2代表一个情况microevolutionary过程“物种形成”事件导致宏观进化论模式。

为了测试这些假设,我们分析了分子的发展史发现标点符号在SARS-CoV-2进化的程度。我们测试的净数量是否沿着root-to-tip lineage-branching事件或内部节点路径预测root-to-tip散度的变化,占基因组采样时间。这种方法概括当前测试不时在当代物种进化模型(16)。的背景下,我们也评估了标点符号在整体sarbecoviruses和SARS-CoV-1程度。描述进化模式,不仅节奏,提供了深入了解病毒分子多样性。

2材料和方法

2.1 SARS-CoV-2

在2020-05-26,我们从GISAID EpiCoV数据库下载MAFFT-produced多重序列比对29287优质NNNNs (< 5%) SARS-CoV-2基因组(20.,21)。对齐方式是手动检查和修剪删除网站没有一个相应的基地29903元Wuhan-Hu-1参考基因组(MN908947)。使用R v.4.0.2 (22),我们将基因组比29400元短,分离出非人类宿主,缺乏精确的取样日期,或那些没有匹配条目的GISAID元数据。作为推荐,我们戴着面具位置可能影响测序构件(23)。重复序列是过滤掉CD-HIT v.4.8.1 (24)。

我们推断出一个最大似然系谱树IQ-TREE v.1.6.12 (25),允许DNA转换和颠换率,基本频率,和在网站替换率不同(HKY + F +我+ G4)。树是根植于Wuhan-Hu-1复制、武汉/ WIV04 (MN996528)。24基因组早就分支,经过检查,我们删除了九个,可能包含测序工件或失调(补充表1)。最后的样本大小是15019基因组(补充图1)。

从树上,我们计算节点数(净lineage-branching事件)的数量和root-to-tip散度(基因突变积累自SARS-CoV-2共同的祖先)。我们收集基因组采样时间和转换成十进制格式。R包用于提取这些数据是猿v.5.4.1 (26),lubridate v.1.7.9 (27),phytools v.0.7.47 (28),stringr v.1.4.0 (29日)。此外,我们创建了一个三维散点图与htmlwidgets v.1.5.1 (30.)和情节v.4.9.2.1 (31日),在网上补充数据。

评估多少punctuational集解释SARS-CoV-2遗传差异的变化,我们退化root-to-tip散度(y采样时间)(x1)和节点数(x2)(图1)。这种方法结合了模型检查时间信号在病毒和古老的DNA序列(32)和测试不时在当代物种进化模型(16,33)。我们可以写的回归方程y=β0+β1x1+β2x2+ϵ,在那里β0是在树的根(拦截),β1是时候效应(或phylogenetically-corrected意味着进化速率),β2是lineage-splitting效果,ϵ是残差。为了防止过度拟合,我们比较了适合该模型对一个空的模型没有节点数(y=β0+β1x1+ϵ使用贝叶斯信息准则(BIC) (34)。比较BIC得分帮助选择竞争模型中通过考虑模型可能和参数的数量。高于两个(ΔBIC得分差异BIC> 2)代表积极的证据模型BIC分数最低的,最佳拟合(35)。如果SARS-CoV-2进化里边,我们预计增加分子平均散度为每个额外的网络分支事件(β2> 0),占抽样时间。我们也计算了进化的总额的比例由punctuational影响使用公式 2 ( 年代 1 ) β 2 T ,在那里年代是技巧和的数量吗T分支长度的总和(16)。此外,我们决定多少punctuational效应解释了从分子时钟偏差。这个量是隐含的部分R2节点的数量,数量的剩余方差解释为另一种模型,并不是占空模型。的值 2 ( 年代 1 ) β 2 T 和部分R2应该高于零,表明了重大贡献punctuational分子差异。

图1
www.雷竞技rebatfrontiersin.org

图1检测heterochronous序列进化的模式。这里显示进化模式谱的两个极端(渐进和间断进化)当速度是常数(严格的时钟)或变量(放松时钟)。(一)根据严格的,渐进的场景中,突变积累稳步在种系发生树。采样时间解释root-to-tip分歧,没有房间在模型中节点数(净数量的分支事件)。(B)率各不相同,但突变可能仍然不断积累。占采样时间、节点数是独立于root-to-tip散度。此场景说明了随机分布的点不同的节点数(灰度)。(C)另外,当数量显著的突变积累在lineage-branching事件(间断进化),我们预计节点数与root-to-tip规模差异,所描绘的自上而下的梯度。换句话说,不时进化意味着利率变化与家族分裂有关。

我们确保采样时间和节点数不回归模型(即携带类似的信息。多重共线性)通过检查方差膨胀因子(vif)使用R包汽车v.3.0.9 (36)。回归无法检测不时进化是否存在多重共线性。

估计模型参数和可能性,我们使用最大似然算法在系统广义最小二乘(pgl)框架。我们拟合回归模型与R包猿和nlme v.3.1 - 148 (37)。pgl占SARS-CoV-2基因组的non-independence由于共同的祖先,减轻德拉蒙德的担忧等。38)。我们的系统树中提取数据模型的数据协方差。因此,我们佩奇固定λ衡量系统信号(39),一个;由此的λ聚合时一个估计(在线补充数据)。模型拟合后,我们检查了回归假设正常的平等使用系统标准化残差方差(40)。

分支长度的低估树地区用更少的分类单元,称为node-density工件,可以偏见回归估计。检查是否存在的工件,我们使用了δ测试(41),预测节点数(之间的曲线关系n)和root-to-tip散度(x)。方程是n=βxδ,在那里β节点数和root-to-tip之间变化的速度散度。我们预计δ> 1时,node-density工件。

SARS-CoV-2抽样偏差可能会影响结果,所以我们重复子样品数据集的回归。我们子样品树1000倍,对于每个子样品,我们随机选择1000基因组和分析数据集。然后,我们计算一个百分比表示每个分布的95%可信区间(CI) 1000年估计(节点数的影响,部分R2,p度量值,node-density工件δ)。我们还使用一个不同的二次抽样过程的变异,我们随机选择演化支由100 - 10000基因组使用R包Treeio v.1.12.0 (42)。

我们评估是否punctuational贡献SARS-CoV-2进化的程度不同的跨洲和通过时间。估计欧洲大陆的影响,我们增加了指标变量回归以及交互条款允许节点计数效果相差的大陆。方程是 y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 , 一个 年代 一个 = 1 + β 4 x 3 , E u r o p e = 1 + β 5 x 3 , N 一个 e r c 一个 = 1 + β 6 x 3 , O c e 一个 n 一个 = 1 + β 7 x 3 , 年代 一个 e r c 一个 + β 8 x 2 x 3 , 一个 年代 一个 = 1 + β 9 x 2 x 3 , E u r o p e = 1 + β 10 x 2 x 3 , N 一个 e r c 一个 = 1 + β 11 x 2 x 3 , O c e 一个 n 一个 = 1 + β 12 x 2 x 3 , 年代 一个 e r c 一个 = 1 + ϵ ,在那里β3通过β7截距差异参考大陆(非洲)和指定的大陆(例如,x3,亚洲= 1在亚洲),β8通过β12斜率的差异。该模型相比,没有一个简单的模型使用BIC交互方面。测试是否标点下降或增加的程度随着时间的推移,我们添加了一个交互之间的节点数和采样时间(y=β0+β1x1+β2x2+β3x1x2+ϵ)。再一次,我们比较该模型对一个没有交互项。

最后,我们测试了如果标点符号之后仍可检测的大流行。基因组测序的数量增加,但COVID情况下全球上升得更快。随着时间的推移,sample-to-population率降低了。这个不完整的抽样偏差punctuational效应的估计(16),使我们缺乏自信与分析后的结果。我们从GISAID下载两个SARS-CoV-2树:一个包含全球177962基因组采样pre-vaccination发布于2020-12-09 (432021-03-02(上)和另一个n= 458255基因组)血统B.1.1.7迅速蔓延时(9)。从人类基因组主机和那些缺乏精确的采样日期被丢弃。分析这两个大型数据集,我们从15000年每棵树子样品基因组一次(补充图2、3)和5000基因组的100倍。每次重复被移除,所以最后的样本大小各不相同。我们无法重复的屏幕满树由于计算的局限性。2021年3月分析,我们增加了模型之间的跳数的变异占B.1.1.7基因组(y=β0+β1x1+β2x2+β3x3,B.1.1.7 = 1+ϵ)和更复杂的模型B.1.1.7基因组进化速率和程度的不同punctuational效果。同时,我们检测节点数的变化效果随着时间的推移,在许多大陆上,但直到2020年12月避免overparameterization树。

2.2 Sarbecovirus

我们下载Boni et al。(4463基因组)sarbecovirus对齐。这个对齐连接Boni等人称之为non-recombining区域1 (NRR1)。然后,我们构建了一个使用W-IQ-TREE树(45)和使用的模型规范我们SARS-CoV-2 (HKY + F +我+ G4)。这棵树是根植于肯尼亚冠状病毒BtKy72 (KY352407),我们随后删除。三个副本了,留下59基因组(补充图4)。Root-to-tip散度、采样时间、提取和节点数。然而,当采样时间只有(YYYY)或一年的一个月格式(YYYY-MM),我们任意固定采样时间年或月的中间。没有一个准确的日期,因为我们保持基因组sarbecovirus样本量相对较小。修复时提到的不应该引入重大偏差,由于采样时间范围从2004年到2020年。对于处理采样时间数据,我们使用R包lubridate和动物园v.1.8.8 (46)。

测试如果打断进化中存在广泛的sarbecoviruses,我们重复前面的回归分析(y=β0+β1x1+β2x2+ϵ)。这个模型的可能性相比,没有使用BIC节点数。我们检查node-density工件。我们拟合的回归数据集没有九多元异常值,我们发现使用协方差最小行列式的方法实现在R包质量v.7.3.51.6 (47,48)。这种检测方法,使用时建议截止α= 0.01,相当保守。所有九个局外人sarbecoviruses血统导致SARS-CoV-2 +代表SARS-CoV-1基因组(补充表1)。

2.3 SARS-CoV-1

我们下载一个对齐69 SARS-CoV-1基因组Boni et al。44)(58从人类和11果子狸和浣熊犬)。潜在的重组区域已经被删除了。作为一个外,蝙蝠类似非典浸Rp3基因组(DQ071615) (49)被添加到对齐使用MAFFT在线服务(50)。插入的蝙蝠类似非典浸Rp3基因组被移除,保持原来的排列长度。然后,我们推断出一棵树,放弃了复制和非人类的序列(补充图5),并分析了数据集一样sarbecovirus情况(决赛n= 53)。我们也跑的分析没有11离群值(补充表1)。评估小样本大小如何影响punctuational的检测效果,我们子样品SARS-CoV-2树2020年5月发布的1000倍。对于每个子样品,我们改变大小(42基因组与SARS-CoV-1样本大小)和大陆分布的基因组,SARS-CoV-1的匹配。

3的结果

3.1 SARS-CoV-2

我们发现强有力的证据在SARS-CoV-2不时进化到2020年5月( β 2 ^ = 2.3 × 10 6 ± 1.5 × 10 7 ,p值< 0.001;图2)。系统发育回归模型与节点数预测的可能性高于零模型只有采样时间(ΔBIC= 837.5;补充表2)。实际的解释β2预计如下:一个家族对一个突变积累每15分支事件(1∼预计每15节点= 2.3×10突变6预计突变/网站/节点×29903网站×15个节点)。因为纯血统分支范围从0事件/月(武汉/ WIV04或EPI_ISL_402124) ~ 173事件/月(EPI_ISL_443087和EPI_ISL_443685),不时在血统进化结果变量的进化率。

图2
www.雷竞技rebatfrontiersin.org

图22020年5月SARS-CoV-2进化打断了。较高的节点数(净lineage-branching事件)与高root-to-tip散度( β 2 ^ = 2.2 × 10 6 ),占基因组采样时间。为了简单起见,我们绘制non-phylogenetic适合行。

约占总数的13% SARS-CoV-2分子进化是由于发现punctuational效果( 2 ( 年代 1 ) β 2 ^ T = 0.13 )。这个数字是类似发现的植物、真菌和动物、16%±5.4% (16)。此外,punctuational集解释~ 5%的偏离分子钟(部分R2节点数= 0.05;完整的R2= 0.07),与其他进化的估计实体(16)。

回归诊断表明没有违反建模(补充图6)。node-density工件(33,41),一个分支长度的低估树分类单元较少,部分地区的缺席(补充图7)。节点数和采样时间不共线的通货膨胀因素方差低于10VIF采样时间= 1.00;VIF节点数= 1.00)(51)。我们仍然发现不时进化的签名当我们重复子样品的回归数据集(补充图8、9)。此外,我们发现punctuational影响的程度随着时间的推移保持不变(直到2020年5月)和跨洲(补充图10、11)。

分析SARS-CoV-2树木发布于2020年12月和2021年3月也不时进化的证据(补充表3;补充数据12 - 15)。包括参数允许标点符号不同的程度随着时间的推移,在大陆,或血统B.1.1.7没有增加模型足够的可能性,支持标点的恒常性。Punctuational影响仍可检测到大流行后期,但估计要低得多。二次抽样42基因组从2020年5月SARS-CoV-2树表明,欠采样1000倍,为SARS-CoV-2一样在2020年12月和2021年3月,并不总是面具punctuational信号(补充图20)。因此,稀疏的取样后在大流行,COVID病例数上升速度比基因组测序的数量,可能不是最好的解释。可能较低的估计可能是由于一个实际减少punctuational水平(在未被我们的回归模型演化过程中由于异质性)或不同的种系发生树推理方法。

3.2 Sarbecovirus

与SARS-CoV-2相比,我们发现最佳拟合模型缺乏节点数和采样时间(ΔBICintercept-only模型= 3.70;图3;补充表4;补充图16、17)。缺乏root-to-tip时序信号,当正常化发展史,复制Boni et al . (44)发现。Re-analyzing数据没有九离群值改变不了结果,与假设一致,一般来说,sarbecoviruses逐渐进化而来的。Sarbecovirus基因组广泛比SARS-CoV-2测序速度低得多。然而,不时进化的欠采样未必抑制信号(补充图20)。

图3
www.雷竞技rebatfrontiersin.org

图3Sarbecoviruses逐渐进化而来的。最佳拟合模型缺乏预测(节点数和采样时间)。Phylopic轮廓(公共领域)代表主机(蝙蝠燕黄;人类通过传闻Kudis马里;穿山甲斯蒂文·特拉弗)。

3.3 SARS-CoV-1

我们发现没有证据表明SARS-CoV-1进化被打断(图4;补充表5;补充数据18 - 20)。回归模型的采样时间和节点数之间的相互作用是最佳的,但是可能因为离群值。没有11离群值,模型没有预测BIC最低得分。SARS-CoV-1进化逐渐广泛sarbecoviruses。然而,BIC分数只是略低于模型与节点数(ΔBICintercept-only模型= 1.00)。也许,我们缺少了小样本的统计检测标点符号的力量,因为相比SARS-CoV-2数据集大小。支持这个概念SARS-CoV-2二次抽样分析,抽样方案的设计匹配SARS-CoV-1 (补充图20)。一个小样本的大小不会导致一个向下的偏见punctuational效果。然而,这增加了不确定性,从而统计力量。

图4
www.雷竞技rebatfrontiersin.org

图4没有证据表明在SARS-CoV-1不时进化。最佳拟合模型,该模型没有预测(节点数和采样时间)。

4讨论

大约13%的总进化SARS-CoV-2是耦合病毒性多样化。即血统分支更频繁的进化率。事实上,~ 5%的偏离严格可以解释为家族分裂分子钟。独立工作不支持我们的假设的倒数(52)突变开车病毒谱系分支事件(53)。

如上所述,不时出现SARS-CoV-2进化可能通过自然选择或创始人与人际传播的影响。如果标点符号来源于选择,我们希望标点下降溢出事件后,随着SARS-CoV-2继续适应人类。我们将进一步预测,标点符号后不同的跨洲的程度选择压力的变化(例如,COVID-19干预和主机人口)。大多数突变在大流行也应该表现出签名的积极的选择。然而,我们没有发现任何迹象表明punctuational效应下降随着时间的推移,至少直到2020年5月,或在不同大洲。和普遍的证据缺乏SARS-CoV-2积极的选择(4,6,18,54)。punctuational效应估计较低的分析SARS-CoV-2 2020年12月和2021年3月树,这可能是由于方法论上的差异推断树木或真正的减少,我们的模型不能捕获由于异质性的进化过程。如果后者是正确的,可能是SARS-CoV-2不时进化与最初的全球传播的病毒和标点减弱后,达到稳定状态。“这投机需要系统建模方法的可伸缩的前所未有的SARS-CoV-2数据集的大小。,不时通过选择进化SARS-CoV-2可能并没有出现。

相反,SARS-CoV-2不时进化和奠基者效应是一致的。病毒(微生物),这种影响与狭窄的传输瓶颈(17,18)。瓶颈大小的一个到八个病毒,传播SARS-CoV-2人口的多样性大大低于在宿主多样性(18)。多数情况下,多数人的传播程序是由变体。然而,当小变异传播,由此产生的共识序列变化,检测到突变或替换(18)。这些罕见的实例可以解释为什么一个小但SARS-CoV-2进化显著比例应计在人与人之间传播。

我们没有发现在sarbecoviruses广泛和SARS-CoV-1 punctuational影响。这个结果与假设一致整体sarbecoviruses逐渐进化,因为他们长期的水库,蝙蝠,已经适应了容忍(55,56)。强大的净化选择作用于蝙蝠sarbecoviruses (54,57创始人)可以抵消效应。较小的变异在传播的亚种,不符合新宿主环境可能是选择性的删除。SARS-CoV-1,结果可能是由于缺乏统计力量产生的少量的测序基因组相对于SARS-CoV-2,符合一项研究报告缺乏证据的变异进化率(44)。所以,我们不能自信地认为SARS-CoV-1进化被打断。

我们检测到的标点SARS-CoV-2不同于之前报道的水泡性口炎病毒(58)、流感病毒(10- - - - - -12)和myxovirus (59)。这些研究将标点符号等同于tachytelic(快速)沿着单一的分支进化系统树(60),类似于问题的起因的变体(4,9,61年,62年)。这些变异没有出现标点符号,但通过加速进化与慢性感染(63年)。据我们所知,我们的研究首次检测不时在病毒进化一样的感觉·和古尔德的间断平衡(15):进化(即集中在物种形成事件。lineage-branching事件)。

通过这种研究,我们已经扩大了工具箱为研究连续采样在大流行性流感病毒的进化动力学鳞片。Punctuational进化是不同于可变利率(heterotachy)或加速进化(快速进化),不一定与物种形成。这对病毒如何进化和传播有着重要的影响在人群中。例如,约会的血统是至关重要的研究病毒遍及全球。我们的研究表明,punctuational进化时应该考虑重构传播路线以及祖先序列。我们的发现也有助于澄清过程如何产生大规模传播的水平宏观进化论利率和多样化。SARS-CoV-2进化可能代表的宏观进化论后果microevolutionary过程,这有助于我们连接个人更大的群体动力学传染病感染。

数据可用性声明

我们收集原始数据的一部分(SARS-CoV-2多重序列比对)从GISAID whichrequires加入验证访问。GISAID禁止storingthese原始数据在一个公共平台。其余的数据、代码在figshare andanalysis输出可用存储库:https://doi.org/10.6084/m9.figshare.21300972

作者的贡献

所有作者的文章和批准提交的版本。

资金

KS得到了蒙大拿州立大学分子生物科学奖学金计划。张东健是由大学的研究生研究奖学金读(奖gs21 - 122)。出版费支付了蒙大拿州立大学图书馆开放存取作者基金。

确认

我们感谢布莱克Wiedenheft和皮匠Wiegand讨论和建议,坦纳,具体来说,早期SARS-CoV-2系统发育树。石头大佬,它垄断控制我们感谢马克·佩格尔威廉f,深时间生物学实验室早期草案建设性的评论。最后,我们感谢所有作者请基因组数据GISAID共享。

的利益冲突

作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。

出版商的注意

本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。

补充材料

本文的补充材料在网上可以找到:https://www.雷竞技rebatfrontiersin.org/articles/10.3389/fviro.2023.1066147/full补充材料

引用

1。约翰霍普金斯大学和医学。冠状病毒资源中心。(2022)。https://coronavirus.jhu.edu/(2022年10月9日)

谷歌学术搜索

2。Duchene年代,费瑟斯通L, Haritopoulou-Sinanidou M,兰姆伯特,Lemey P, Baele g .时序信号和SARS-CoV-2 phylodynamic阈值。病毒的另一个星球(2020)6 (2):veaa061。doi: 10.1093 / / veaa061

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

3所示。谁。跟踪SARS-CoV-2变体。(2022)。

谷歌学术搜索

4所示。哈维WT, Carabelli,杰克逊B,古普塔RK,汤森EC,哈里森EM, et al . SARS-CoV-2变异,变异和免疫逃逸。Nat Microbiol牧师(2021)19 (7):409 - 24。doi: 10.1038 / s41579 - 021 - 00573 - 0

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

5。王曹Y, J,剑F,肖T,歌W, Yisimayi, et al .ο逃脱大多数现有SARS-CoV-2中和抗体。自然(2022)602 (7898):657 - 63。doi: 10.1038 / s41586 - 021 - 04385 - 3

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

6。李Dearlove B, Lewitus E,白H, Y,李维斯DB,乔伊斯毫克,et al . SARS-CoV-2候选疫苗可能会匹配所有目前流行的变体。《美国国家科学院刊年代。(2020)117 (38):23652 - 62。doi: 10.1073 / pnas.2008281117

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

7所示。德拉蒙德AJ, Ho SYW菲利普斯MJ,兰姆伯特a放松系统发生学和约会有信心。公共科学图书馆杂志(2006)4 (5):e88。doi: 10.1371 / journal.pbio.0040088

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

8。马Suchard Lemey P Baele G, Ayres DL,德拉蒙德AJ,兰姆伯特a .贝叶斯系统发育和phylodynamic数据集成使用野兽1.10。病毒的另一个星球(2018)4 (1):vey016。doi: 10.1093 / / vey016

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

9。希尔V, Du Plessis) L,孔雀TP, Aggarwal D, Colquhoun R, Carabelli, et al . SARS-CoV-2血统的起源和分子进化B.1.1.7在英国。病毒的另一个星球(2022)8 (2):veac080。doi: 10.1093 / / veac080

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

10。史密斯DJ, Lapedes,郑大世JC de, Bestebroer TM, Rimmelzwaan GF, Osterhaus ADME, et al .映射流感病毒的抗原和基因进化。科学(2004)305 (5682):371 - 6。doi: 10.1126 / science.1097211

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

11。狼,Viboud C,福尔摩斯EC, Koonin EV, Lipman DJ。长间隔的停滞中时不时的积极的选择季节性甲型流感病毒的进化。杂志直接。(2006)1 (1):34。doi: 10.1186 / 1745-6150-1-34

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

12。佩特洛娃VN,罗素CA,季节性流感病毒的进化。Nat Microbiol牧师(2018)16 (1):47-60。doi: 10.1038 / nrmicro.2017.118

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

13。主动脉壁E,鲍林l .进化趋异和融合蛋白。:布赖森V,傅高义黄建忠、编辑。进化的基因和蛋白质。纽约:学术出版社(1965)。p . 97 - 166。

谷歌学术搜索

14。Shackelton LA,达菲年代,福尔摩斯EC。病毒的进化:模式和决定因素。Nat牧师麝猫(2008)9 (4):267 - 76。doi: 10.1038 / nrg2323

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

15。·N,古尔德SJ。间断平衡:系渐变的替代品。编辑:Schopf TJM。模型在古生物学。旧金山,CA:弗里曼,库珀(1972)。p . 82 - 115。

谷歌学术搜索

16。由此M, Venditti C,米德a大Punctuational物种形成的贡献在分子水平上进化趋异。科学(2006)314(5796):119 - 21所示。doi: 10.1126 / science.1129647

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

17所示。兹瓦特MP,艾琳娜科幻。的大小:遗传瓶颈在病毒感染及其潜在影响进化。性研究为基础(2015)2 (1):161 - 79。doi: 10.1146 / annurev -病毒学- 100114 - 055135

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

18岁。Lythgoe KA,大厅M, Ferretti L, M凯撒,MacIntyre-Cockett G, Trebes, et al . SARS-CoV-2宿主中的多样性和传播。科学(2021)372 (6539):eabg0821。doi: 10.1126 / science.abg0821

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

19所示。娃e基因环境的变化和发展。AC:赫胥黎J,哈迪福特EB,编辑。进化是一个过程。伦敦,U。凯西:艾伦安文& (1954)。p . 157 - 80。

谷歌学术搜索

20.Katoh K,史坦利DM。MAFFT多重序列比对软件版本7:改善性能和可用性。另一个星球杂志(2013)30 (4):772 - 80。doi: 10.1093 / molbev / mst010

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

21。蜀Y,麦考利j . GISAID:全球共享所有流感数据项目——从愿景到现实。Eurosurveillance(2017)22日(13):30494。1560 - 7917. - es.2017.22.13.30494 doi: 10.2807 /

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

22。R核心团队。接待员:统计计算的语言和环境。奥地利维也纳:R统计计算(2020)的基础。

谷歌学术搜索

23。De Maio N,沃克C,博尔赫斯R, Weilguny L, Slodkowicz G,高盛N问题SARS-CoV-2测序数据。病毒学(2020)。https://virological.org/t/issues-with-sars-cov-2-sequencing-data/473。(2020年5月5日)

谷歌学术搜索

24。傅L,牛B,朱Z,吴年代,李w . CD-HIT:加速集群下一代测序数据。生物信息学(2012)28日(23):3150 - 2。doi: 10.1093 /生物信息学/ bts565

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

25。阮LT,施密特哈,冯Haeseler,明BQ。IQ-TREE:一个快速和有效的随机算法估计最大似然的发展史。另一个星球杂志(2015)32 (1):268 - 74。doi: 10.1093 / molbev / msu300

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

26岁。- E, Schliep k猿5.0:一个现代系统发生学和环境进化分析R。生物信息学(2019)35 (3):526 - 8。doi: 10.1093 /生物信息学/ bty633

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

27。Grolemund G,韦翰与lubridate h .日期和时间很容易。J统计软件40 (2011)(1):1 - 25。doi: 10.1093 /生物信息学/ bty633

CrossRef全文|谷歌学术搜索

28。瑞LJ。phytools: R包系统发育比较生物学(和其他)。生态方法另一个星球(2012)3(2):217 - 23所示。doi: 10.1111 / j.2041 - 210 x.2011.00169.x

CrossRef全文|谷歌学术搜索

29。韦翰H。stringr:简单、一致的包装为常见的字符串操作。(2019),R包。

谷歌学术搜索

30.谢Vaidyanathan R, Y,阿莱尔JJ,拉塞尔Chang J, K。htmlwidgets: HTML小部件R。(2019),R包。https://CRAN.R-project.org/package=htmlwidgets

谷歌学术搜索

31日。西韦特C。交互式网络数据可视化与r、阴谋和闪亮。纽约,纽约州:查普曼和大厅/ CRC (2020)。

谷歌学术搜索

32。兰姆伯特,林TT,马克斯•卡瓦略L Pybus噩。探索heterochronous序列的时序结构使用风暴(原名path-O-Gen)。病毒的另一个星球(2016)2 (1:vew007。doi: 10.1093 / / vew007

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

33。韦伯斯特AJ,佩奇佩恩RJH, m .分子进化和物种形成的发展史联系。科学(2003)301 (5632):478 - 8。doi: 10.1126 / science.1083202

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

34。施瓦兹的g .估计模型的维度。安统计(1978)6 (2):461 - 4。doi: 10.1214 /市场/ 1176344136

CrossRef全文|谷歌学术搜索

35。阿布AE。在社会研究贝叶斯模型选择。Sociol Methodol(1995)25:111 - 63。doi: 10.2307/271063

CrossRef全文|谷歌学术搜索

36。福克斯J,韦斯伯格。R同伴应用回归。第三。千橡市,CA:圣人出版物(2019)。p。608。

谷歌学术搜索

37岁。ibsen Pinheiro J,贝茨D, DebRoy年代,Sarkar D。核心团队,R。nlme:线性和非线性混合效应模型。(2019),R包。

谷歌学术搜索

38。德拉蒙德AJ, Pybus噩,兰姆伯特Forsberg R,罗德里戈AG)。明显进化种群。趋势生态另一个星球(2003)18 (9):481 - 8。doi: 10.1016 / s0169 - 5347 (03) 00216 - 7

CrossRef全文|谷歌学术搜索

39岁。由此推断生物进化的历史模式。自然(1999)401 (6756):877 - 84。doi: 10.1038/44766

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

40。Freckleton RP。七宗罪的比较分析。J另一个星球(2009)22 (7):1367 - 75。doi: 10.1111 / j.1420-9101.2009.01757.x

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

41岁。佩奇Venditti C,米德,m .检测node-density工件在系统重建。系统医学杂志55 (2006)(4):637 - 43。doi: 10.1080 / 10635150600865567

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

42。戴王LG、林TTY、徐年代,Z,周L,冯T, et al。Treeio: R包系统树与丰富的注释和相关的数据输入和输出。另一个星球杂志37 (2020)(2):599 - 603。doi: 10.1093 / molbev / msz240

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

43。我们的世界在数据。冠状病毒(COVID-19)疫苗。(2021)。https://ourworldindata.org/covid-vaccinations。(2021年7月6日)

谷歌学术搜索

44岁。Boni MF, Lemey P,江泽民X,林TTY,佩里BW Castoe助教,et al .进化起源的SARS-CoV-2 sarbecovirus血统负责COVID-19大流行。Nat Microbiol(2020)5(11):1408 - 17所示。doi: 10.1038 / s41564 - 020 - 0771 - 4

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

45岁。Trifinopoulos J,阮LT,冯Haeseler明BQ。W-IQ-TREE:快速在线系统极大似然分析的工具。核酸Res(2016)44 (W1): W232-5。doi: 10.1093 / nar / gkw256

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

46岁。Zeileis, Grothendieck g .动物园:S3基础设施常规和非常规时间序列。J统计软件(2005)14 (1):1-27。doi: 10.18637 / jss.v014.i06

CrossRef全文|谷歌学术搜索

47岁。维纳布尔斯WN,里普利BD。现代应用统计学(2002)。纽约:斯普林格出版社(2021年7月访问5)。

谷歌学术搜索

48。草地的C,克莱因O, Dominicy Y,雷C .多元异常值检测:使用一个健壮的变体的距离。J Exp Soc Psychol(2018)74:150-6。doi: 10.1016 / j.jesp.2017.09.011

CrossRef全文|谷歌学术搜索

49。林泰鸿CC, ZL,德拉蒙德AJ, Yip CW,曾庆红F,等。重组蝙蝠起源的证据严重急性呼吸系统综合症(SARS)——冠状病毒及其影响SARS冠状病毒的直接祖先。J性研究(2008)82(4):1819 - 26所示。doi: 10.1128 / JVI.01926-07

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

50。Katoh K, Rozewicki J,山田KD。MAFFT在线服务:多重序列比对,选择和可视化交互序列。短暂Bioinform(2019)20 (4):1160 - 6。doi: 10.1093 /龙头/ bbx108

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

51。Vittinghoff E, Glidden DV, Shiboski SC,麦克洛克CE。生物统计学中回归方法:线性、逻辑、生存,和重复测量模型。第二版。纽约:斯普林格出版社(2012)。p。512。

谷歌学术搜索

52岁。Pennell MW,哈蒙LJ, Uyeda JC。有间断平衡的余地大进化?趋势生态另一个星球(2014)(1):29日23-32。doi: 10.1016 / j.tree.2013.07.004

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

53岁。范村落L,理查德·D Tan CCS,肖LP Acman M, Balloux f .没有证据表明增加传播性在SARS-CoV-2复发性突变。Nat Commun(2020)11 (1):5986。doi: 10.18637 / jss.v014.i06

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

54。MacLean OA Lytras年代,韦弗年代,歌手JB,博尼MF, Lemey P, et al。自然选择进化的蝙蝠SARS-CoV-2创建了一个多面手病毒和人类病原体。公共科学图书馆杂志(2021)19 (3):e3001115。doi: 10.1371 / journal.pbio.3001115

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

55。巴纳吉,贝克ML,卡尔克撒K, Misra V, Plowright R, Mossman K .小说的蝙蝠见解的免疫系统。前面Immunol(2020)2411:26。doi: 10.3389 / fimmu.2020.00026

CrossRef全文|谷歌学术搜索

56。欧文,安米,吴作栋G,安德森DE,王低频。教训宿主防御的蝙蝠,一个独特的病毒水库。自然(2021)589 (7842):363 - 70。doi: 10.1038 / s41586 - 020 - 03128 - 0

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

57。张唐X,李G, Vasilakis N, Y, Z,钟Y, et al。微分逐步SARS冠状病毒的进化功能的蛋白质在不同的宿主物种。BMC另一个星球杂志(2009)9 (1):52。doi: 10.1186 / 1471-2148-9-52

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

58岁。Nichol圣罗我,惠誉WM。间断平衡和积极的达尔文进化论在水泡性口炎病毒。《科学(1993)90 (22):10424 - 8。doi: 10.1073 / pnas.90.22.10424

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

59。克尔PJ,伊甸园JS, Di Giallonardo F,孔雀D,刘J,努力T, et al。不时粘液瘤病毒的进化:快速、分离的最近的病毒的进化谱系在澳大利亚。J性研究(2019)93 (8):e01994-18。doi: 10.1128 / JVI.01994-18

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

60。辛普森GG。在进化过程中节奏和模式。纽约,纽约州:Hafner出版社(1944)。p。237。

谷歌学术搜索

61年。泰JH,波特房颤,Wirth W, Duchene s SARS-CoV-2变体的出现的问题是由加速度替换率。另一个星球杂志(2022)39 (2):msac013。doi: 10.1093 / molbev / msac013

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

62年。Lythgoe KA, Golubchik T,大厅M T, MacIntyre-Cockett G,油炸锅H, et al .血统替换和演化被英国covid感染调查。medRxiv(2022)。doi: 10.1101 / 2022.01.05.21268323v1。2022.01.05.21268323。

CrossRef全文|谷歌学术搜索

63年。Chaguza C,哈恩,Petrone我,周年代,弗格森D, Breban MI, et al。加速SARS-CoV-2 intrahost进化导致不同基因型在慢性感染。medRxiv(2022)。doi: 10.1101 / 2022.06.29.22276868v1。2022.06.29.22276868。

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

关键词:SARS-CoV-2、sarbecovirus SARS-CoV-1,不时进化、分子进化

引用:苏利耶K,加德纳JD和器官CL(2023)检测在SARS-CoV-2不时进化的第一年大流行。前面。性研究。3:1066147。doi: 10.3389 / fviro.2023.1066147

收到:2022年10月10日;接受:07年2月2023;
发表:2023年2月23日。

编辑:

克里斯·伊林沃思英国剑桥大学

审核:

城镇n Pimenoff瑞典卡罗林斯卡医学院(KI)
安德鲁Comas-Garcia墨西哥圣路易斯波多西自治大学的
塞巴斯蒂安Duchene墨尔本大学,澳大利亚

版权©2023苏亚加德纳和器官。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

*通信:凯文•苏利耶kevinsurya@montana.edu;克里斯•l .器官c.l.organ@reading.ac.uk

下载