深入的遗传特性SARS-CoV-2流行在为期两年的框架在北马其顿使用第二代和第三代测序技术
- 1实验室的病毒学、公共卫生学院、北马其顿斯科普里
- 2部门传染病预防和控制,公共卫生学院,北马其顿斯科普里
- 3自然科学和数学学院,北马其顿斯科普里、生物学研究所
严重急性呼吸系统综合症冠状病毒2 (SARS-CoV-2)有一个持续的负面影响在公共卫生和全球经济。理解的起源、传播途径和发现的突变改变了病毒的传播性和致病性,全身SARS-CoV-2基因组分子特征。集中在两年的时间(2020 - 2021),我们提供深入的病毒学和流行病学概述SARS-CoV-2流行在北马其顿共和国通过评估的频率和分布循环SARS-CoV-2变体。使用遗传特性和系统发育分析我们揭示病毒的分子进化以及测试特定SARS-CoV-2之间可能联系单和临床症状的严重程度。我们的测试结果表明,五分之一(21.51%)的呼吸道样本SARS-CoV-2是积极的。明显的趋势观察COVID-19感染的发病率和严重程度在60 +年龄组男性和女性之间。阳性病例的总数,SARS-CoV-2发病率最高的是注意到男性在60 +(4170 .4/100,000),具有统计学意义(0,0001)两种性别之间的差异。此外,男性死亡率和必然地增加1.8倍的死亡病例数明显高于同龄的女性相比,观察组(0.001)。总共有327个样本测序在2020年3月- 2021年8月,显示SARS-CoV-2变异的时间分布在北马其顿循环。病毒基因组的系统发育分析表明,大多数是密切相关的,集中在四个独特的血统,责任,B.1.1.7, B.1.351 B.1.617.2。 A statistically significant difference was observed in the 2C_1 haplotype (p=0.0013), where 10.5% of the patients were hospitalized due to severe clinical condition. By employing genetic sequencing, coupled with epidemiological investigations, we investigated viral distribution patterns, identified emerging variants and detected vaccine breakthrough infections. The present work is the first molecular study giving a comprehensive overview of the genetic landscape of circulating SARS-CoV-2 viruses in North Macedonia in a period of two years.
介绍
一个重要的全球公共卫生问题出现在2019年,现在知名的冠状病毒病(COVID-19),造成SARS-CoV-2冠状病毒(1)。SARS-CoV-2疫情已造成大约6.17亿例COVID-19和6,全世界500万人死亡,2022年9月19日(https://www.worldometers.info/coronavirus/)。
29903个核苷酸长,单链RNA beta-coronavirus称为SARS-CoV-2编码两个结构性和非结构性蛋白(2)。为了调节膜融合和细胞入口,斯派克(S)糖蛋白,是至关重要的认识到人类宿主细胞表面受体血管紧张素转换酶2 (ACE-2) (3,4)。病毒破坏宿主细胞分子功能一旦进入细胞,诱导干扰素反应,最终细胞凋亡。变异引起的担忧(挥发性有机化合物的仪器)S基因的突变有可能改善“病毒适应性”通过增强ACE-2受体亲和力,易传染,病毒复制,传播能力,抵抗中和抗体,免疫逃逸,从而导致疾病严重程度和再感染的风险增加(5)。
迄今为止,五个变种的担忧(挥发性有机化合物的仪器)世界卫生组织指定的:五个挥发性有机化合物的仪器得到了认可,包括B.1.1.7(α),B.1.351(β),第1页(γ)B.1.617.2(δ)和B.1.1.529(买卖)(https://www.who.int/activities/tracking-SARS-CoV-2-variants)。阿尔法变种被D614G氨基酸突变特征,N501Y H69-V70删除,β受体结合域的三个关键基因突变(RBD)的S蛋白——K417N E484K N501Y和三角洲的主要变化D614G T478K和L452R (6)。ο变体包含15个突变仅RBD和超过30 S蛋白的突变,这可能减少治疗性抗体的有效性和提高ACE2绑定(7)。尽管有相同的起源,这些菌株的发病机理不同,遗传性疾病严重程度,疫苗效力和疾病严重程度。
因此,长篇SARS-CoV-2基因组的分子特性是必不可少的理解病毒的起源、传播途径和基因变异影响病毒的致病性和遗传性。对于那些参与抗击传染病,测序数据基本信息。他们帮助疫苗和抗病毒药物的发展,系统发育分析,跟踪病毒的传播,监控病原体的进化,发展其他诊断测试和确定任何初级和中级人畜共患主机(8)。
我们研究的目的是给深入的病毒学和流行病学概述SARS-CoV-2流行病在2020年1月至2021年12月在北马其顿,评估频率和循环SARS-CoV-2变体的分布,辨别SARS-CoV-2通过遗传特性的分子进化和系统发育分析和发现,如果任何,联系SARS-CoV-2单和临床症状的严重程度。此外,我们比较了纳米孔测序结果Illumina公司和作为第二代和第三代测序平台。
材料和方法
总数284549呼吸道样本(鼻腔和咽喉拭子)前瞻性收集从2020年1月至2021年12月在实验室的病毒学研究所的公共健康。分析样本包括病人的实验室常规检测区域中心的公共卫生、住院病人的临床样本COVID-19中心和私人旅行测试。抽样进行的1 - 7天症状的发病症状的病人,而通常无症状阳性病例被发现在个人旅游目的测试或家庭成员/联系人的确诊病例。交通运输在所有病毒样本中(VTM)(科潘诊断公司,Murrieta CA,美国),伴随着病人的匿名形式,包括年龄、性别、取样日期、居住地和症状。排除标准包括使用不合适的传输媒体,延长运输时间没有合适的制冷或媒体溢出。从测试样品的总数,327整个SARS-CoV-2基因组被测序。测序的样品是随机选择的,考虑到平等的地理分布的样本。所选样本周期阈值较低(≤30)进一步进行测序。
伦理批准
伦理道德委员会批准是来自医学院的大学”学生。西里尔和Methodius”,北马其顿(03-4731/4)。
SARS-CoV-2检测和分子特性
从呼吸道病毒RNA提取样本进行使用RNeasy迷你工具根据制造商的指示(试剂盒、希尔登,德国)。大流行开始后不久,由于我们开始使用自动提取的高吞吐量,翠鸟™Flex净化系统(热费希尔,麻萨诸塞州,美国)和samag - 96 (Sacace,科莫,意大利)根据制造商的指示。所有SARS-CoV-2测序样品都是选re-isolated RNeasy迷你工具,以获得更高的病毒RNA的完整性和质量。病毒RNA检测与SARS-CoV-2实时进行RdRP双基因逆转录(RT)聚合酶连锁反应(PCR),巴斯德研究所提供的开发和法国巴黎(9)。此外,我们做了一个内部通过添加一个内部改善分析RP控制,验证了根据找到的建议(10)。第二个设备用于测试是TaqPath COVID-19 CE-IVD rt - pcr试剂盒(热费希尔,麻萨诸塞州,美国),目标三个基因(ORF1ab N,年代),根据制造商的指示。由于α变体H69-V70删除,不能放大年代基因发生在使用TaqPath rt - pcr试剂盒。样品被认为是SARS-CoV-2积极如果内部控制放大和至少两个SARS-CoV-2基因目标被rt - pcr检测化验。
纳米孔测序
汽车列车网络ncov - 2019测序协议是用于多路复用PCR扩增子的方法(11)。逆转录反应进行了使用LunaScript RT SuperMix(内,美国)加上六聚体非特异性引物,如随机和锚定polyT,从之前稀释依法提取Ct值。放大整个基因组,两个池(A和B)的多重PCR引物组v1利用(12)。2、5的合成cDNAµl利用每个池的模板。使用32周期对所有样本,瓷砖400 nt-amplicons 20碱基对重叠(不包括引物)。UltraII结束预科反应模块的使用(内,美国),PCR扩增子池end-repaired,本机前dA-tailed条形码的结扎与NEBNext UltraII结扎模块(内,美国)。执行库清理后AMpure XP珠子和短片段缓冲区(SFB),位于安大略省的库中筛选了15μl洗脱缓冲。dsDNA HS分析工具是用来量化的扩增子量子位2.0荧光计(热费希尔科学、美国)。使用当地人条码包EXP-NBD104 / EXP-NBD114(永久)和结扎kit SQK-LSK109测序,图书馆准备奴才排序是按照制造商的说明和修改按Josh快速et al。(13)。最后库测序FLO-MIN106 (R9.5)流动细胞,同时多路复用每运行24个样本。安大略省的测序运行不同的长度根据基因组实时报道,尽管他们通常持续了大约24小时。
纳米孔生物信息学工作流程
实时可视化基因组覆盖率和参考匹配每个条码进行使用RAMPART工具(阅读作业、映射和系统发育分析实时),开发的汽车列车网络(14)。创建fast5和fastQ文件,完成实时basecalling使用MinKNOW及其集成孔雀鱼高精度模型(v3.5.2)(一)。最低q-score读必须达到通过qscore过滤是7,大致相当于basecall精度为85%。basecalling之后,我们使用EPI2ME及其相关工具懦夫快速物种鉴定以及全面的质量控制指标来了解运行的性能。使用永久孔雀鱼条码软件v3.1.5 + 781 ed575 quality-checked读取去复用和修剪的适配器。使用CLC基因组工作台版本20.0.4、映射对齐、共识创造,和变体调用完成后(试剂盒、希尔登,德国)。我们进行了并行数据分析使用各种星系工具(https://usegalaxy.eu)。使用Minimap2 (v2.9),数据映射兑SARS-CoV-2参考045512年(NC) (15)。SAMtools深度是用来获得覆盖率数据,而ivar共识(v 1.3.1)是用于生成一个共识序列。对于变种叫我们使用nanopolish (v0.13.2) (16)。数据手动检查使用平板电脑(v1.19) (17)。
Illumina公司测序
混合capture-based针对性的浓缩方法都使用了Illumina公司DNA预科浓缩设备。NEBNext®UltraTM II第一链合成模块和NEBNext RNA®UltraTM二世无方向性的RNA第二链装备新英格兰生物学实验室,美国马)被用来创建双链cDNA从5µL (< 10 ng)的RNA。根据制造商的指示,生成的cDNA被利用作为输入文库制备Illumina公司DNA预科浓缩设备(18)。纯化扩增子被用于图书馆准备,按照制造商的说明。这些指令要求tagmentation停止tagmentation 3洗,PCR与索引、upstage大小选择和净化前个人库池(18)。Pre-enriched库被大规模集中。呼吸道病毒生物素化的相邻oligoprobes面板中,扩展到包括SARS-CoV-2担任浓缩过程的基础19)。48样本测序Illumina公司MiniSeq系统使用MiniSeq高输出试剂盒(150 -周期)。协议可以找到详细的实验室方法。io (20.)。
Illumina公司生物信息学工作流程
使用Illumina公司动态读取分析基因组学(DRAGEN;v3.5.13;Illumina公司)看到你的平台,从RVP捕获测序数据处理方法。使用CLC基因组工作台版本20.0.4、映射对齐、共识创造,和变体调用完成后(试剂盒、希尔登,德国)。此外,我们使用了星系平台工具(https://usegalaxy.eu/)和读取映射使用burrows - wheeler对准器MEM算法(BWA-MEM) (v0.7.7)对SARS-CoV-2引用045512年(NC)。SAMtools深度是用来评估基因组覆盖率。我们利用ivar共识(v1.3.1)来创建的共识序列和ivar varaints识别变异(v 1.3.1)。数据手动检查使用平板电脑(v1.19) (17)。
Illumina公司质量标准
基本质量指标用于Illumina公司测序仍然很高,满足预期值排序。六MiniSeq运行,Q-score > 30介于97.8%到91之间。
统计分析
所有统计测试和可视化进行了R (v4.1.1),使用ggplot2 (v3.3.5) dplyr (v1.0.7)和tidyr (v1.1.3)包。卡方检验和费舍尔准确测试进行了“统计数据”包。此外,Microsoft Excel 2016为Windows和OpenEpi (http://www.openepi.com/Menu/OE_Menu.htm)被用于统计数据分析。假定值< 0,05年被认为是具有统计学意义。
系统发育分析
ClustalW (21)是用于创建核苷酸比对和大型(分子进化遗传学分析v.11)被用来使密码子的位置(22)。最大似然的种系发生树使用大型通用时间可逆模型(GTR)推断,与1000年复制和引导分析用于确定树的拓扑结构的可靠性。为了更好的系统发育树的图形表示无花果树v1.4.4使用(23)。序列数据存入——全球共享禽流感数据项目(GISAID) EpiCoV数据库(24)。
结果
时间分布SARS-CoV-2病毒的病例
共有284549名呼吸道样本检测SARS-CoV-2在两年的时间内,其中61206(21.51%)呈阳性。在检查期间,三大波浪观察由三个不同的变体。即第一波跨越从41周52/2020和激增的情况下是由责任(20和20 b)血统。周46/2020,最多的实验室确诊病例在观察期间(n = 2544)。α变体的出现推动了第二波,从周7/2021,达到最高的阳性病例数在12周(n = 2187)。北马其顿的流行病学状况表现出稳定的趋势周18/2021,导致几个月非常低的多的积极的检测。第三个SARS-CoV-2波开始由于三角洲变体的出现,数字快速增长的31/2021 (n = 85)每周33/2022 (n = 775) (图1)。主要循环变量n马其顿三角洲直到星期52/2021,接手之前最新ο变体。
此外,我们分析了SARS-CoV-2阳性病例以年龄和性别,检查任何可能的显著差异。对于年龄组,最多的SARS-CoV-2发现阳性病例在年龄60 + (n = 16276),而具体的发病率最高的4101 .9/100,000注册在50 - 59岁(n = 11496)(年龄图2)。高发病率观察年龄40至49(3688 .4/100,000)和- 39(3322 .7/100,000),在11160年和10770年积极SARS-CoV-2例检测到,分别。进一步,当分析的发病率SARS-CoV-2阳性病例以年龄和性别分类的最具体的发病率在男性中观察60 +组(4170 .4/100,000),而女性中发病率最高50 - 59岁年龄组(4376 .2/100,000)是(图3)。阳性病例的数量在60 +组明显高于男性相比女性(0.0001)。
图3发病率SARS-CoV-2阳性病例在2020年1月- 2021年12月以年龄和性别。男性和女性之间的统计上的显著差异在60 +年龄(0.0001)使用星号(*)标记。男性指定用蓝色,分别与红色,而雌性。
SARS-CoV-2死亡的时间分布
四个独特的峰出现在SARS-CoV-2阳性患者死亡的病例数,下面的模式的出现和引入新变种人口(图4)。最高记录的死亡病例数周12/2021 (n = 81),在α波。
我们分析了死亡病例以年龄和性别,检查任何可能的显著差异。死去的男性和女性的发生率是最高的年龄段60 +(分别为5213/100000和294年,7/100,000),但死亡率男性高出1.8倍,而女性在60 +集团(图5)。此外,男性死亡的病例数在60 +组相比明显高于女性组(p = 0.001)。
图5SARS-CoV-2死亡病例的发病率在2020年1月- 2021年12月以年龄和性别。死亡人数统计上的显著差异的情况下,男性和女性之间60 +年龄组(p = 0.001)是标有星号(*)。男性指定用蓝色,分别与红色,而雌性。
SARS-CoV-2病毒的遗传特性和系统发育分析
总共有327个样本测序在2020年3月- 2021年8月。大部分的检测到突变(n = 56)位于ORF1ab地区,其次是S蛋白(n = 27)和n蛋白(n = 12) (表1)。ORF1ab地区的突变热点nsp12或RdRP蛋白窝藏最常见的突变nsp12: P323L(98.78%)观察到在几乎所有的序列。nsp6蛋白质,三重删除nsp6: F108del, nsp6: G107del, nsp6: S106del达到59.15%的频率。同样,nsp3存在三个突变A890D I1412T和T183I频率高于50% (54.88%。分别为50.91%和57.01%)。S蛋白的D614G突变频率最高(93.6%),其次是H69-V70del (64.63%)、N501Y (60.98%)、Y144del, S982A D1118H (59.76%)。在N蛋白,R203K(69.82%)和G204R(68.29%)是最常见的突变。所有替换频率低于3%不表所示。
这一研究获得的所有SARS-CoV-2基因组(n = 327)被选为系统发育分析,采用最大似然法(图6)。完整的病毒基因组注释使用的参考基因组hCoV-19 /武汉/ Hu-1/2019 (NC_045512.2)。病毒发展史是基于每个样本的共识序列组装和分支表明进化样本之间的差异。基于系统树,PANGO先前建立的聚类序列匹配的血统:责任,B.1.1.7, B.1.351 B.1.617.2。责任血统为特征的几个独特的分支,代表不同的演化支。的一大部分测序病毒聚集在一起,因为他们属于B.1.1.7血统。B.1.351血统是由只有一个检测到的情况下,聚类与病毒从意大利、德国和斯洛文尼亚。三角洲血统病毒聚集成几个不同的演化支,都是非常密切相关。补充表1包含所有测序病毒名称为每个血统。
在2020年3月- 2021年1月在北马其顿责任线成为主流。不同责任演化支流传在上述期间,20 b是占主导地位的进化枝今年3月,2020年8月和9月(100%)。2020年4月,我们注意到co-circulation演化支20和20 b(分别为66.7%和33.3%),但是没有发现,直到2021年1月20 (38.6%)。进化枝20 d(λ)观察只有2021年1月,频率为4.5%。病毒属于进化枝20 e检测连续三个月1 2021频率较低(分别为2.3%、2.2%和2.1%)。2021年1月第一个病例属于B.1.1.7血统被证实与测序(11.4%),与2月迅速增加(57.8%)。2021年3月到6月这段时间成为主流的B.1.1.7血统与近100%的频率。2021年5月,我们发现第一个证实B.1.351血统(案例中,然而这血统没有继续循环内的人口。2021年7月,我们发现co-circulation 3种不同δsubclades 21 j(41.4%)、21我21岁(8.6%)和一个(1.4%),连同α变异(48.6%)。2021年8月,清晰可见,δ已经完全接管,与δ21 j(87.5%)成为占主导地位的变体(图7)。图8显示了在北马其顿SARS-CoV-2变异的地理分布。最多数量的变异被发现在斯科普里,作为最大的人口和最多数量的测试样本。
我们更进一步,分组组成相同的基因组到不同的单替换的独特组合,在一个特定的血统(图9)。单由峰值和non-spike替换整个SARS-CoV-2基因组(表2)。单体型1为特征的突变N: K405 *, nsp12: P323L, nsp12: M924R nsp14: Y420stop,占主导地位的单体型循环2020年(100%)。1期2021年1 - 2月刊,单体型窝藏额外的突变N: R203K,护士:G204R, nsp3: D1121N, nsp5: G71S, nsp12: P323L,年代:D614G和S: Q677H达到36%的频率。单体型2被一些新出现的突变特征,特别是在蛋白质(L189F,年代:N439K,年代:D614G,年代:V772I,年代:S939F;S: H69 -和S: V70)的频率为20.2%。2单体型,由所有签名α变异突变(N: D3L N: R203K,护士:G204R,护士:S235F, nsp3: T183I, nsp3: A890D, nsp3: I1412T, nsp12: P323L, NS8:问*,NS8: R52I, NS8: Y73C,年代:N501Y,年代:A570D,年代:D614G,年代:P681H,年代:T716I,年代:S982A,年代:D1118H, nsp6: S106del, nsp6: G107del, nsp6: F108del,年代:H69-V70del,年代:Y144del)到达它的主导地位,在2021年5月- 6月的73.5%。单体型2 a_1 ORF1ab地区存在三个额外的突变相比,单体型1 (nsp2: T44I nsp3: E405A nsp6: L260F),达成的频率时间2021年5月- 6月的12%。单体型2 a_4包含三种不同的突变,其中包括在S蛋白(nsp12: N215Y nsp14: H455Q,年代:S221L),然而它的频率在2021年5月- 6月的只有3.6%。单体型2 c, 2021年7 - 8月在频率达到53.2%,其次是单体型2 c₁(8.5%)。唯一突破感染属于单体型特征2 c₂,因为它既不是纯粹的21个三角洲,也都共存突变的21个我δ进化枝。 This haplotype harbored a signature set of 7 co-appearing mutations (nsp2:P129L, nsp3:H1274Y, nsp3:P822L, nsp4:A446V, nsp6:V149A, nsp15:H234Y and N:R385K).
此外,通过分组突变成单,我们试图关联一组签名的飙升和non-spike星座的突变与疾病的临床表现(图10)。统计上的显著差异是观察到的单体型2 c₁组(p = 0.0013),其中10.5%的患者住院由于严重的临床状况。这个单体型特征是几个独特的突变年代,N和ORF1ab蛋白质。流行病学数据显示,所有单体型2 c₁病例立即收到一个确认后住院积极SARS-CoV-2结果,仍在医院至少三个星期。都有氧气的要求,但没有一个是机械通风。没有并发症的报道。很高比例的住院病人观察单体型2 c组(14%),但没有统计学意义(p = 0.2618)。此外,近一半的SARS-CoV-2测序情况下,从住院病人收集属于单体型2(49.1%),然而当相比门诊组相同的单体型没有发现显著差异(p = 0.3797)。
第二代和第三代测序测序深度和指标
均值与Illumina公司平台相对于纳米孔测序深度获取平台2450 x覆盖率和856 x报道,分别。读取和序列长度Illumina公司的平均数量是1683 .900和30 - 150个基点,不过读与纳米孔的数量明显降低(81109),但像预期的那样产生序列的长度在100 - 3000个基点。通过过滤器设置为> 85%,覆盖的基因组> 10倍。21个样品没有通过测序指标和都有超过30的Ct值。映射读取相似的百分比98.36%两个平台(Illumina公司)和98.16%(纳米孔),然而映射读取不同的phr分数(分别为35和16)。此外,每个基地的平均错误率每读Illumina公司为0.005%,而纳米孔的出错率高0.12%。尽管高错误率在纳米孔测序读、高精度consensus-level序列测定实现最低~ 60倍以上覆盖深度。
讨论
2019年12月以来出现极度传染性病毒和危险的SARS-CoV-2宣称全球数百万人的生命。SARS-CoV-2基因组一直以来快速变化的大流行,并有证据表明这些变化影响病毒的致病性(25- - - - - -28)。从地理区域的不同变体SARS-CoV-2出现的流行病学条件允许某些基因组合的稳定,影响了他们的健康(25- - - - - -28)。在这项研究中,我们分析了两年最伟大的流行的现代社会所面临的。
2020年1月到2021年12月,在北马其顿的流行病学状况是由三个主要特征波驱动的责任,B.1.1.7(α)和B.1.617.2(δ)血统,类似世界各地(29日- - - - - -31日)。四个独特的峰出现在已故SARS-CoV-2感染病人的数量,以下的模式的出现和引入新变种。男性的死亡率为1.8倍相比,女性在60 +集团因此死亡病例的男性在同一组相比明显高于女性(p = 0.001)。排除前病史的病人作为一个因素影响患者的性别和死亡率之间的联系,我们评估并发症的比例在60 +年龄组。即60 +组死去的患者中,83.1%的男性有并发症(82.3%的心血管疾病,31.6%的糖尿病和肺部疾病的14.1%),而并发症报道85.3%的女性(85.7%的心血管疾病,37.2%的糖尿病和肺部疾病的19.5%)。尽管并发症显著的发展贡献更多的严重临床条件以及死亡,他们在两组比例相当,因此,男性和女性之间死亡率显著差异并不是由于他们现有的医疗条件。类似的观察在不同的研究在意大利,美国和中国(32- - - - - -34),进一步支持我们的发现SARS-CoV-2感染男性更糟糕的结果的风险和死亡。荟萃分析显示,年龄有显著影响COVID-19病人死亡率,与一个重要分界点> 50尤其是> 60岁(35)。这些结果符合老年人的观察患者对感染的易感性较高和更严重的临床表现由于生理衰老和特别,并存病的患病率更高,导致更严重的临床的发展条件(36)。
SARS-CoV-2有适度的突变速度相比其他广泛的病毒如流感(37)。因此,SARS-CoV-2不大可能发生突变的变化,如抗原漂移和抗原转变,改变病毒的基因组成和影响如何传染,传染性和致病性。然而,超过3000个不同的点突变被发现在来自世界各地的病毒分离株,表明增加的频率改变在流感大流行期间SARS-CoV-2基因组(38)。几个SARS-CoV-2基因,包括年代,N,nsp12(RdRP),有一个突变范围宽(6)。在我们的研究中大多数的突变是位于ORF1ab和S蛋白的基因区域。大流行开始后不久,ORF1ab成为其中一个突变热点,尤其是nsp2, nsp3,nsp12(39,40)。我们观察到类似的结果nsp3, nsp6和nsp12窝藏在ORF1ab突变频率最高的地区。Nsp12编码RdRp蛋白存在最常见的突变nsp12: P323L(98.78%)观察到在几乎所有序列,同样在其他的研究(41)。的蛋白质已经记录有80多个替换突变和缺失,最引人注目的是L452R,其次是E484K, D614G, A222V, L18F S477N,分别H69-V70del和N501Y (41)。在北马其顿D614G S蛋白的突变频率最高(93.6%),导致增强显示绑定ACE2受体和增加复制人类支气管和鼻气道上皮的文化(42)。截至2021年12月初,这种突变在> 600万年病毒基因组的99% GISAID数据库(43)。RBD N501Y突变增加了ACE-2受体的亲和力和遗传性(6,44),并在我们的研究达到一个频率为60.98%。
病毒基因组的系统发育分析表明,大多数密切相关,集中在四个PANGO指定的血统,责任,B.1.1.7, B.1.351 B.1.617.2。基因组之间的遗传距离不大,考虑到这部小说SARS-CoV-2病毒出现最近进化的时间尺度非常小。测序分析显示,在2020年3月- 2021年1月期间责任血统北马其顿成为主流,在世界各地(30.,31日)。B.1.1.7变体首次发现和传播在英国45),抵达我们的国家在2021年初。迅速收购和完整的优势在接下来的几个月中,由于其突变景观导致遗传性(40 - 70%的增长46)。
特定键替换促进ACE2受体的亲和力和影响感染和传播,特别是在RBD (N501Y)和接近furin裂解位点(P681H) (26)。β变体和B.1.1.7都有一些共同的突变以及关键氨基酸变化K417N, E484K, N501Y, D614G和A701V峰值蛋白质。由于存在E484K突变的蛋白质,β家族已经报道有更强的遗传性和免疫逃避能力(47),然而这是不成功的在我们国家只发现一个案例。一种解释可能是,β变体不是充分代表由于温和的测序量。另一个可能的可能性可以后期引入这种变体,阿尔法已经建立了自己的统治地位后,三角洲已经开始建立它的存在。竞争的两个变体和高传播性的三角洲,最有可能阻碍β的传播。α相比,显著突变L452R, T478K, D614G和P681Rδ负责增加其遗传性和住院的风险(48- - - - - -50)。似乎RBD和ACE-2交互和传染性增强L452R突变(51)。此外,RBD-ACE-2复杂稳定的随着L452R T478K突变,这就增加了病毒的传染性。此外,增加的遗传性和病毒载量与P681R突变,这是出席S1和S2之间的分裂点(52)。
SARS-CoV-2变体的高传播性和传染性通常归因于蛋白质变化,而在非结构性突变基因的快速积累导致病毒致病性(不断发展和变化53)。通过分组突变成单,我们试图找到一个与签名的飙升和non-spike星座替换与疾病的临床表现。在2020年占主导地位的循环单体型是单体型1窝藏突变N: K405 *, nsp12: P323L, nsp12: M924R nsp14: Y420stop。1单体型由替换N: R203K,护士:G204R, nsp12: P323L和S: D614G,然而在2021年1月首次发现。菌株携带突变的结合:D614G nsp12: P323L已经在全球范围内,尽管这两个突变的个体的存在并未产生成功的血统(54)。2021年,由于出现的许多新substitutons和多样化的突变景观SARS-CoV-2病毒,几种不同的单体型co-circulated同期。很高比例的住院病人在2摄氏度的单纯但没有统计学意义(p = 0.2618)。由于它的出现相对较晚大流行,2020年6月,突变N: D63G非常有趣。核蛋白质N,这是最丰富的蛋白质和负责包装病毒基因组,最有可能已经影响了传染性病毒滴度(43)。最引人注目的观察和统计上的显著差异的单体型2 c₁病例中,有10.5%的病人由于严重的临床住院条件(p = 0.0013)。而其他研究已经发现一个协会B.1.617.2几率较高的氧需求,ICU住院或死亡(28),我们的研究发现强关联的一组签名的突变(单体型2 c₁)与严重的临床结果。几乎70%的单体型2 c₁患者男,我们发现确凿的男性更容易严重临床条件和死亡。所有情况下属于单体型2 c₁住院至少三个星期,由于病情的严重程度和氧气都有要求,但没有一个是机械通风。重大变化在ORF1ab N地区和S蛋白引起的散度的单体型原型21δ,这可能会选择压力的结果由于越来越多的疫苗接种率(53)。单体型的一个签名的突变2 c₁,年代:2020年A222V,出现第一个B.1.177血统。遗传背景的年代:A222V突变出现似乎对于其生存能力和流行病学意义的突变可能会受到上位接触突变,年代:T478K和S: L452R,也可能修改的行为开放RBD (55)。因此我们可以考虑S: A222V发生变异的一个例子,不止一次在SARS-CoV-2突起蛋白但并没有伴随着一种改进的流行病学健身。人口预测这些小说的成功突变可能通过追踪他们的交互与遗传背景中出现。唯一突破感染属于单体型特征2 c₂它存在一套签名的7 co-appearing突变和相同的突变被发现在一个小数量的样品来自印度和欧洲(丹麦)(53)。即使我们只有一个突破感染在我们的研究中,我们怀疑,真正的数字可能更高。总人口的疫苗接种率在北马其顿的δ波是一剂为40.8%,35.1%,两剂为0.5%,助推器接种疫苗的人。大荟萃分析表明,COVID-19疫苗的有效性三角洲变异为86% (RR = 0.14, 95%置信区间CI: 0.07 - -0.54) (56)。此外,booster-vaccinated个体表现出显著减少感染率与non-booster-vaccinated主题(57)。失去免疫力造成穷人助推器疫苗接种覆盖率是一个似是而非的北马其顿突破感染的原因,因为它已经证明了保护三角洲变体消退在接种疫苗的人随着时间的推移,一个额外的疫苗剂量恢复保护(58)。此外,发现感染的疫苗接种提供78%保护三角洲变体,防止住院治疗和预防死亡(91% 90%59)。在这种背景下,高数量的住院和严重的临床状况,尤其是在2 c₁单体型,可能是由于整体疫苗接种覆盖率低。
研究的一个主要的限制是不知道这部分病人的常规测试,由于临床症状加剧,随后入院治疗。因此,没有一个准确的估计的tested-to-subsequently住院的病人,我们的分析是基于样品收到诊所。另一个缺点是测序的少量样品,尤其是在大流行的前10个月。缺乏资金和小测序量总体上,导致在特定时期的代表和变异过程中流行。此外,系统收集和分析SARS-CoV-2突破感染,可能会得到更多明确的遗传景观和突变浓缩等情况。
在对抗COVID-19大流行,测序被用来补充流行病学调查,研究病毒传播,发现和识别新兴变异和理解疫苗突破感染。感谢上天的广泛可用性工具和基因组信息的在线分享,变异,变异通常追踪和大量的完整的基因组信息从不同国家流感大流行的影响。
任何长期循环SARS-CoV-2熊的风险增加健身的病毒进化组突变赋予更大的遗传性,免疫逃避,或者比先前的变异程度。除了突变,主要spike-recombinant疫苗也可能non-spike内共病的突变蛋白的影响。因此,实时监测SARS-CoV-2突变样本可以揭示其功能在免疫逃避潜在或中和效果(60)。
目前的工作是第一个分子的研究提供一个全面的概述SARS-CoV-2传播病毒的遗传景观在北马其顿在一段两年。这项研究提供了一个通过顿悟SARS-CoV-2传播病毒的进化和多样性及其与疾病的临床表现的关系。
数据可用性声明
病毒的名字存入GISAID和用于系统发育分析(http://www.gisaid.org)。加入数字提供了补充表1。进一步调查应该指向相应的作者。
道德声明
涉及人类受试者的研究伦理委员会审查和批准的医学院,大学“党卫军。西里尔和Methodius”,北马其顿。书面知情同意参加本研究参与者提供的法定监护人/近亲。
作者的贡献
MV, GB, SM和搞笑的概念和设计研究。门将和DK组织数据库。DK, MV执行统计分析。MV,结核病,EJ,美联社,女士,和4月进行实验室分析。MV写的手稿。所有作者的文章和批准提交的版本。
的利益冲突
作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。
出版商的注意
本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。
补充材料
本文的补充材料在网上可以找到:https://www.雷竞技rebatfrontiersin.org/articles/10.3389/fviro.2022.1064882/full补充材料
引用
3所示。杰克逊CB的大学生,陈B, Choe h . SARS-CoV-2进入细胞的机制。Nat牧师摩尔细胞杂志(2022)23 (1):3。doi: 10.1038 / s41580 - 021 - 00418 - x
4所示。刘Ou X, Y, Lei X,李P Mi D,任L, et al .表征飙升的糖蛋白SARS-CoV-2与冠状病毒条目及其免疫大。Nat Commun(2020)11 (1):1620。doi: 10.1038 / s41467 - 020 - 15562 - 9
5。Blanco-Melo D, Nilsson-Payant,刘含水量,Uhl年代,霍格兰D, Møller R, et al。不平衡主机响应SARS-CoV-2 COVID-19驱动发展。细胞(2020)181 (5):1036 - 45. e9。doi: 10.1016 / j.cell.2020.04.026
6。马隔溪Focosi D, f .中和抗体逃脱SARS-CoV-2突起蛋白:风险评估基于抗体covid-19疗法和疫苗。牧师地中海性研究(2021)(6):31日e2231。doi: 10.1002 / rmv.2231
7所示。沙米,吸引HG。ο:严重变异SARS-CoV-2变体展品更强的约束力ACE2,强有力地逃脱批准COVID-19治疗性抗体。前面Immunol(2022)12。doi: 10.3389 / fimmu.2021.830527
8。Udugama B, Kadhiresan P科兹洛夫HN Malekjahani,奥斯本M,李v, et al .诊断COVID-19:疾病和检测工具。ACS Nano(2020)14 (4):3822 - 35。doi: 10.1021 / acsnano.0c02624
9。世界卫生组织。实时rt - pcr检测SARS-CoV-2化验。(巴黎:巴斯德研究所)(2021)。可以在:https://www.who.int/docs/default-source/coronaviruse/real-time-rt-pcr-assays-for-the-detection-of-sars-cov-2-institut-pasteur-paris.pdf。
10。促进创新诊断方法基金会(发现)。找到内部测试开发SARS-COV-2的分子检测。瑞士日内瓦20212020。可以在:https://www.finddx.org/wp-content/uploads/2020/09/COVID-19-Testing-in-the-Laboratory-Sept2020.pdf。
11。汽车列车网络。汽车列车SARS-CoV-2。(2021)。可以在:https://artic.network/ncov - 2019。
12。快速的J。汽车列车ncov 1 - 2019测序协议。(2021)。可以在:https://www.protocols.io/view/ncov - 2019测序bp2l6n26rgqe/v1——协议。
13。快速的J, Grubaugh ND、Pullan圣克拉洛雪茄烟IM,史密斯广告,Gangavarapu K, et al。奴才和illumina公司测序的多重PCR方法zika病毒基因组和其他直接从临床样本。Nat Protoc(2017)12 (6):1261 - 76。doi: 10.1038 / nprot.2017.066
14。Mapleson D, Drou N, Swarbreck D RAMPART:工作流管理系统新创基因组组装。生物信息学31 (2015)(11):1824 - 6。doi: 10.1093 /生物信息学/ btv056
17所示。米尔恩我斯蒂芬·G拜耳M,旋塞PJ, Pritchard L, Cardle L,等。使用平板电脑视觉探索第二代测序数据。Briefi Bioinf(2013)14 (2):193 - 202。doi: 10.1093 /龙头/ bbs012
18岁。Illumina公司。Illumina公司DNA预科与浓缩。(2021)。可以在:https://emea.support.illumina.com/content/dam/illumina support/documents/documentation/chemistry_documentation/illumina_prep/illumina - dna预科-与-浓缩-引用-指导- 1000000048041 - 07. - pdf。
19所示。道O 'Flaherty BM,李Y, Y,派登CR、张J, K女王等。全面病毒浓缩使敏感的呼吸道病毒基因的识别和分析下一代测序。基因组Res(2018)28 (6):869 - 77。doi: 10.1101 / gr.226316.117
20.李阮J人力资源,T, Prystajecky N,泰森J。快速、高通量图书馆准备SARS-CoV2 V.3使用illumina公司的DNA预备库准备工具包。(2022)。可以在:https://www.protocols.io/view/rapid-high-throughput-library-preparation-of-sars-b3vgqn3w。
21。拉金,Blackshields G,布朗NP, Chenna R, McGettigan PA,坎迪娅·迈克威廉H, et al . Clustal W和Clustal X 2.0版本。生物信息学(2007)23日(21):2947 - 8。doi: 10.1093 /生物信息学/ btm404
22。Kumar年代,Nei M,达德利J,田村k .兆:biologist-centric软件进化分析的DNA和蛋白质序列。简报Bioinf(2008)9 (4):299 - 306。doi: 10.1093 /龙头/ bbn017
24。蜀Y,麦考利j . GISAID:全球共享所有流感数据从项目愿景变为现实。Eurosurveillance(2017)22日(13):30494。1560 - 7917. - es.2017.22.13.30494 doi: 10.2807 /
25。查达J, Khullar L,米塔尔n .面对神秘的突变的忿怒:回顾的出现严重急性呼吸系统综合症冠状病毒2变种在冠状病毒disease-19大流行。环境Microbiol(2022)24 (6):2615 - 29。doi: 10.1111 / 1462 - 2920.15687
26岁。莫里斯CP、罗CH Amadi,施瓦茨M, N加拉格尔,雷SC,等。一个更新在严重急性呼吸系统综合症冠状病毒2美国国家首都地区的多样性:小说和变异的进化问题。中国感染说(2022)74 (8):1419 - 28。doi: 10.1093 / cid / ciab636
27。哈基姆女士,Wibawa H, Trisnawati我Supriyati E,海雷丁再保险公司依斯干达K, et al .预后因素和结果之间的联系的患者感染SARS-CoV-2窝藏多个突起蛋白突变。Sci代表(2021)11 (1):24。
28。与昂,卫生CJ, Ang LW,麦t m,崔L(英里/小时,等。临床和病毒学特征SARS-CoV-2变异的担忧:回顾性队列研究比较b。1.1。7(α),b。1.315(β)和b。1.617。2(δ)。中国感染说(2022)75 (1):e1128-e1136。doi: 10.1093 / cid / ciab721
29。Morawiec E, Miklasińska-Majdanik M, Bratosiewicz-Wąsik J, Wojtyczka RD, Swolana D, Stolarek我,等。从αdelta-genetic流行病学的SARS-CoV-2 (hCoV-19)在波兰南部。病原体(2022)11 (7):780。
31日。Basheer, Zahoor i基因流行病学的SARS-CoV-2透露责任,B.1.36和B.1.1.7作为最主要的血统在第一,第二,第三波SARS-CoV-2感染在巴基斯坦。微生物(2021)9 (12):2609。doi: 10.3390 / microorganisms9122609
33。Quaresima V, Scarpazza C, Sottini不快C,年青男子,Delmonte OM, et al。性别差异在一群COVID-19意大利病人住院在第一和第二大流行浪潮。临床生物性别差异(2021)12 (1):45。
34。Finelli L,古普塔V, Petigara T, Yu K,鲍尔KA, Puzniak洛杉矶。2020年美国与SARS-CoV-2感染患者住院死亡率。JAMA Netw开放(2021)4 (4):e216556。doi: 10.1001 / jamanetworkopen.2021.6556
35。Bonanad C, Garcia-Blas年代,Tarazona-Santabalbina F,桑吉J, Bertomeu-Gonzalez V, Facila L, et al . COVID-19患者年龄对死亡率的影响:一个荟萃分析611583例。J是董事协会(2020)21 (7):915 - 8。doi: 10.1016 / j.jamda.2020.05.045
36。任王黄C, Y,李X, L,赵J,胡锦涛Y, et al .临床特征的患者感染2019新型冠状病毒在武汉,中国。《柳叶刀》(2020)395 (10223):497 - 506。doi: 10.1016 / s0140 - 6736 (20) 30183 - 5
37岁。阿斯利康。SARS-CoV-2的自然进化:科学如何回应这些挑战。(2021)。可以在:https://www.astrazeneca.com/what -科学-能- do/topics/covid 19/the -自然进化- - sars - x - 2.的html。
38。Flores-Alanis, Cruz-Rangel, Rodriguez-Gomez F,冈萨雷斯J, Torres-Guerrero CA, Delgado G,等。分子流行病学监测SARS-CoV-2:突变和遗传多样性一年后出现。病原体(2021)10 (2):184。doi: 10.3390 / pathogens10020184
39岁。贝内代蒂Pachetti M,马里尼B, F, F Giudici,毛罗·E, Storici P, et al .新兴SARS-CoV-2突变热点包括小说RNA-dependent-RNA聚合酶变异。J反式(2020)18 (1):1 - 9。doi: 10.1186 / s12967 - 020 - 02344 - 6
40。任Y,蜀,吴D,μJ,王C,尹浩然,黄。SARS-CoV-2 ORF3a蛋白质的细胞发生凋亡。细胞摩尔Immunol(2020)17 (8):881 - 3。doi: 10.1038 / s41423 - 020 - 0485 - 9
41岁。谢里夫N, Alzahrani KJ,艾哈迈德SN,汗一个,Banjer HJ, Alzahrani调频,等。基因监测、进化和全球传播SARS-CoV-2期间2019 - 2022。《公共科学图书馆•综合》(2022)17 (8):e0271074。doi: 10.1371 / journal.pone.0271074
42。周B,涛TTN,霍夫曼D, Taddeo,艾伯特N, Labroussaa F, et al . SARS-CoV-2飙升D614G变化增强了复制和传播。自然(2021)592 (7852):122 - 7。doi: 10.1038 / s41586 - 021 - 03361 - 1
43。Wassenaar TM,湾仔V, Buzard G, Ussery DW。前三波covid-19流行的暗示SARS-CoV-2有限的遗传曲目。《牧师(2022)46 (3):fuac003。doi: 10.1093 / femsre / fuac003
44岁。Sudre CH,格雷厄姆女士可能,安东内利M,穆雷B,条例T, et al。症状的变化,再感染和传播性与SARS-CoV-2变体B。1.1。7:生态研究。柳叶刀公共卫生(2021)6 (5):e335-e45。
45岁。英国公共卫生。调查小说SARS-CoV-2变体:变体关注的202012/01,技术简报3(2020)。可以在:https://assets.publishing.service.gov.uk/government/uploads/system/uploads/attachment_data/file/950823/Variant_of_Concern_VOC_202012_01_Technical_Briefing_3_-_England.pdfpdf。
46岁。华盛顿问Gangavarapu K,泽勒米,Bolze, Cirulli ET, Schiabor巴雷特公里,ET al .出现和快速传播SARS-CoV-2 B.1.1.7在美国。细胞(2021)184 (10):2587 - 94. - e7。doi: 10.1016 / j.cell.2021.03.052
47岁。按H,威尔金森E, Giovanetti M, Iranzadeh,丰V, Giandhari J, et al .检测SARS-CoV-2变体在南非的担忧。自然(2021)592 (7854):438 - 43。doi: 10.1038 / s41586 - 021 - 03402 - 9
48。Galloway SE,保罗P, MacCannell博士,约翰逊,布鲁克斯JT,麦克尼尔,et al . SARS-CoV-2 b。1.1的出现。7 lineage-united州,2020年12月29日——1月12日,2021年。病态的许多工作代表(2021)70 (3):95。
49。杨W,萨满j .流行病学特点三SARS-CoV-2变异的担忧和对未来COVID-19流行的结果。medRxiv(2021)2021:2021.05.19.21257476。doi: 10.1101 / 2021.05.19.21257476
50。王P Casner RG Nair女士,王M, Yu J, Cerutti G, et al。阻力增加P SARS-CoV-2变体。1抗体中和。细胞宿主细菌(2021)29日(5):747 - 51. - e4。doi: 10.1016 / j.chom.2021.04.007
52岁。Cherian年代,Potdar V, Jadhav年代,Yadav P,古普塔N, Das M, et al . SARS-CoV-2突变,L452R, T478K, E484Q P681R,第二波COVID-19在马哈拉施特拉邦,印度。微生物(2021)9 (7):1542。doi: 10.3390 / microorganisms9071542
53岁。巴纳吉,Mazumder,罗伊·J Majumdar, Chatterjee, Biswas NK, et al .δ变异的进化non-spike签名co-appearing突变:开拓者COVID-19疾病的结果。bioRxiv(2022)2022:2022.04.05.487103。doi: 10.1101 / 2022.04.05.487103
54。Ilmjarv年代,阿卜杜勒·F, Acosta-Gutierrez年代,Estarellas C, Galdadas我,卡西米尔M, et al .并发依赖RNA的RNA聚合酶的突变和突起蛋白成为最成功的流行病学SARS-CoV-2变体。Sci代表(2021)11 (1):13705。
55。Ginex T, Marco-Marin C, Wieczor M,马塔CP, Krieger J, Ruiz-Rodriguez P, et al . SARS-CoV-2遗传背景的结构性作用在峰值突变的出现和成功:飙升的情况下A222V突变。PloS病原体(2022)18 (7):e1010631。
56。Mahumud RA,阿里妈妈,茶室,拉赫曼,卡马拉JK, Renzaho飞行员。COVID-19疫苗的有效性三角洲变体(B.1.617.2):一个荟萃分析。疫苗(2022)10 (2):277。
58岁。戈德堡Y,曼德尔M,酒吧YM,这样啊,弗里德曼LS,火山灰N, et al。保护和减弱SARS-CoV-2自然和混合免疫。N拉米夫地中海(2022)386(23):2201 - 12所示。doi: 10.1056 / NEJMoa2118946
59。Severson Scobie HM,约翰逊AG) Suthar AB, R,奥尔登NB, Balter年代,et al .监测COVID-19发病率情况下,住院治疗,和死亡,通过接种疫苗status-13美国司法管辖区,2021年7月4日4月17日。病态的工作代表(2021)70 (37):1284。
关键词:SARS-CoV-2变异,流感大流行、遗传特性、分子进化,挥动
引用:Vukovikj M, Boshevska G, Janchevska E, Buzharova T, Preshova, Simova M, Peshnacka, Kocinski D, Kuzmanovska G, Memeti年代和Gjorgoski我(2023)深入的遗传特性SARS-CoV-2流行在为期两年的框架在北马其顿使用第二代和第三代测序技术。前面。性研究。2:1064882。doi: 10.3389 / fviro.2022.1064882
收到:08年10月2022;接受:2022年11月23日;
发表:2023年1月04。
编辑:
Manish钱德拉。乔杜里,布里格姆妇女医院和哈佛医学院、美国版权©2023 Vukovikj、Boshevska Janchevska、Buzharova Preshova, Simova, Peshnacka, Kocinski, Kuzmanovska, Memeti Gjorgoski。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。
*通信:玛雅Vukovikj时,kuzmanovskamaja1@gmail.com