毒性的相互作用网络域的甲型流感和鼠标的蛋白质
- 计算机科学与工程学院,南洋理工大学,新加坡,新加坡
存在多个数据库提供病毒-宿主蛋白质相互作用。虽然大多数提供策划记录宿主蛋白对互动,信息毒株特异性毒性因素或蛋白质域,是缺乏的。一些数据库提供完整的报道流感毒株,因为需要筛选大量的文献(包括主要包括艾滋病毒和登革热病毒,除了其他人)。没有提供完整,应变特定蛋白质交互记录流感病毒。在本文中,我们提出一个全面的网络预测domain-domain交互(s) (DDI)甲型流感病毒(IAV)和鼠标宿主蛋白质,可以让疾病因素的系统研究,考虑到毒性信息(致死剂量)。从以前公布的数据集的致命剂量的研究IAV感染小鼠,我们构造了一个域的网络互动鼠标和病毒蛋白质域与加权边缘节点。边缘与域交互统计得分(DISPOT)来表示假定的DDI潜力。毒性网络很容易导航通过一个web浏览器,毒性相关信息(LD50值)进行了突出显示。网络将援助流感疾病建模与蛋白质相互作用域提供毒株特异性毒性水平。它可能导致计算方法发现流感感染机制介导通过蛋白质域病毒和宿主蛋白质之间的相互作用。它是可用的https://iav-ppi.onrender.com/home。
1介绍
甲型流感病毒(IAV)是一种单链,积极的核糖核酸(RNA)病毒呼吸道病原体在许多物种如人类,猪,野生水禽。它由八个基因片段编码至少11蛋白质。病毒粒子的结构和组织所示图1这里,复制从荣格和李的工作(荣格和李,2020年)。
图1。IAV粒子及其完全组装组成蛋白质。基因组RNA片段所示绿色,缠绕在核蛋白质。PB1 hetero-trimeric依赖RNA的RNA聚合酶组成的复杂,PB2,和爸爸是橙色,光明与黑暗的蓝色圆圈。这个数字是由荣格和李(荣格和李,2020年)。
血凝素(HA)和神经氨酸酶(NA)病毒粒子表面,蛋白质负责调停进入和从宿主细胞分裂,分别。基质蛋白1 (M1)是病毒包围的一个组成部分,而基质蛋白2 (M2)下面发现病毒膜的脂质双分子层,加强它。一起的核蛋白(NP),他们vRNP的核糖核蛋白复合体(表示形式图1)。最后三个蛋白质聚合酶的基本1第二帧(PB1-F2)和非结构性蛋白1和2 (NS1 NS2),分别。
IAV可以在人类和几个高度毒性高致病性毒株已经在多个大流行事件引起全世界数以百万计的死亡。估计死亡人数为1918 (H1N1), 1957 (H2N2)和1968 (H3N2)大流行是5000万(约翰逊和米勒,2002年),110万(Viboud et al ., 2016)和1 - 4百万(罗杰斯,1968),分别。此外,IAV引发各种呼吸道疾病季节性的,使其在人群中流行。每年由于流感相关的呼吸道疾病的死亡人数从季节性流感估计近300000年到646000年之间的变化(Iuliano et al ., 2018)。因为它是在人群中流行,主机窝藏季节性流感菌株为重组事件可以作为储层,导致与其他循环相互传染病原体如SARS-CoV-2形成有害的重组菌株(不要et al ., 2022)。这些属性突出呼吸道病原体和疾病因素的复杂性表明大规模流感研究的需要。他们也使公共卫生的连续监测结果的必要。
感染小鼠模型的研究有助于阐明宿主因素负责毒性,因为它们是成本有效的,可再生的和允许的机械分析,不得直接进行人类由于道德原因(Sarkar Heise, 2019)。测量IAV的致病性的一个方法是通过获得的致死剂量接种动物测试50%的人口感染或灭亡(缩写是有限的50)(尤金,2001)。通过比较不同株流感感染的老鼠,结果差异由于老鼠的等位变异株可能是可能是建立(陆et al ., 1999)。
一方面,数据库如HPIDB (Ammari et al ., 2016)和字符串病毒(库克et al ., 2018)除了几人已经覆盖了甲型流感和人类蛋白质之间的相互作用在一个广泛的方式。相比之下,在鼠标的交互主机缺乏。存在很少的数据库记录IAV-mouse交互(实验和计算方法)。
另一方面,它是具有挑战性的直接研究甲型流感毒性的影响在人类宿主由于道德的考虑。老鼠被用来推断疾病病理IAV的人类(陆et al ., 1999)。小鼠有显著差异在身体大小和分布影响组织取向在发病机理(Masemann et al ., 2020;珀尔曼2016年),目前被广泛接受的临床前模型链接毒性水平IAV-host交互(Masemann et al ., 2020)。收集IAV-mouse蛋白质相互作用提供了一种实用的方法来识别毒力因素。作为一个例子,在确定影响小鼠宿主因素的预测与IAV蛋白质相互作用网络,人类同系物的相应的设置(目标蛋白质)可以从相同的组合确定映射,毒性水平和文学有关的证据。体外互动是发生在目标蛋白质和IAV (通过生物化学分析或细胞培养)可以协助设计淘汰赛因素或将使药物靶点已在鼠标的交互模型的验证。
数据记录小鼠模型传染性研究先前收集的早期作品由F.X.伊万和C.K. Kwoh (伊凡和Kwoh, 2019年)。他们的研究强调了角色PB2蛋白网站的流感毒性通过使用基于规则的系统分析模型预测的毒性。因此,宏观毒性标签之间的联系(如LD50类别)和蛋白质的相互作用可能是有益的在理解IAV毒性的因素。Domain-domain交互(s) DDI可能特别有用,因为蛋白质域通常是一个离散的功能单位,具有模块化、和蛋白质-蛋白质之间的关系依靠DDI的组合(Itzhaki et al ., 2006;Alborzi et al ., 2021)。因此,网络是由代表节点的域。而“domain-domain”交互是通过定义一个子集的蛋白质相互作用,这里引用术语交替使用,除非另有指定。
系统地识别潜在IAV和鼠标宿主蛋白质之间的相互作用,蛋白质之间的网络组成的假定的DDI IAV和鼠标蛋白质,域交互统计得分的潜力(DISPOT) (Narykov et al ., 2019)开发工作。
蛋白质网络提出了一个清晰的图形用户界面(GUI),轻松地显示了LD50价值观和相互作用蛋白质域的C57BL / 6 j小鼠被DISPOT应变。毒性的蛋白质交互网络域将协助IAV疾病的研究提供数据建模的假定的互动与LD蛋白质域相关联50值。
本手稿的其余部分组织如下。第二节内容和细节设计和描述数据提出了数据库和数据管理过程。第三节详细描述了web服务器实现,描述使用的工具,图形用户界面的布局和功能。第四部分详细讨论这些数据。第五部分概述了提出了未来的工作。第六节总结和结论。
2内容和设计
图2概述了步骤实现IAV-Mouse蛋白质交互(PPI)数据库。IAV-Mouse PPI web服务器可以访问:https://iav-ppi.onrender.com/home。
表1概述了数据的收集。五的八IAV基因组的RNA片段,即PB1、HA、NA, M1, NS1被发现含有病原体蛋白质域进行交互。总之,31日独特的双ddi之间被发现七IAV蛋白质域和29个鼠标领域。
这项工作建立在小鼠模型的初始数据记录传染性研究收集之前的工作由F.X.伊万和C.K. Kwoh (伊凡和Kwoh, 2019年)。他们同样分配毒性水平的过程之后。LD50值所需的关键信息识别一个特定的毒性类IAV的压力。毒性分为两种(无毒/毒性),三级(低/中级/高)(所示图3)。从本质上讲,总感染记录分为“毒性”两下问题是记录的总和列为三级下“中间”和“高”的问题。同样,总感染记录分为“无毒”相当于记录的数量分类为“低”。三级的毒性分类、LD50阈值的103.0和106.0应用(所示表2),引用使用阈值由世界卫生组织(世卫组织)流感病毒小鼠的毒性分类(宰牲节50感染单位)(2003年,)。LD50感染单位包括点状单元(PFU), Focus-forming单元(洁净),50%鸡蛋感染剂量(宰牲节50),50%感染剂量(TCID组织文化50细胞培养感染剂量)和50%(赛迪50),平等被认为在所有单位。
图3。交叉表IAV的亚型和鼠标菌株,彩色根据三级毒性分类问题。“他人”是指感染的聚合记录IAV subtypes-H1N2, H3N8, H5N2, H5N5, H5N6, H5N8, H7N2, H7N3, H7N7, H7N9。
总科2.0序列搜索(https://supfam.org/sequence/search)(Pandurangan et al ., 2019)被用来映射区域的氨基酸序列至少一个蛋白质结构分类(吟游诗人)总科使用总科隐马尔可夫模型。吟游诗人表示基于结构的分层分类的蛋白质域之间的关系,“家庭”是第一层和第二层次“总科”。蛋白质域相同的吟游诗人的家庭密切相关,经常共享相同的函数(Andreeva et al ., 2004)。
DISPOT (http://dispot.korkinlab.org/home/pairs)(Narykov et al ., 2019)担任web工具来确定存在双IAV和鼠标之间的ddi吟游诗人总科域。从DOMMINO DISPOT使用专门ddi (旷et al ., 2012),深入数据库结构解决大分子相互作用,ddi是充足的数据,其来源的数据。对于一个给定的域,DISPOT返回一个统计的潜力,表示为概率Pij。统计潜力值在整个实数的规模。正面和负面的值可以分别解释为有或多或少比一般的ddi数量DOMMINO数据库。中性值对应的ddi数量接近平均数量。“没有信息”将返回而不是数值如果DOMMINO数据库没有特定领域对一个条目。
DISPOT计算潜在统计公式给出的方程如下(Narykov et al ., 2019):
Z2是观察到的自然对数频率DOMMINO域之间的相互作用的数据库。米的意思是是一对相互作用的平均数量域家庭,从冗余计算DOMMINO数据集。冗余是指两个相应的双域不共享95%或者更多的序列标识(Narykov et al ., 2019)。
2.1数据集
57篇文章综述了工作都从国家生物技术中心检索(NCBI) PubMed (林德伯格2000),LD50值显式声明。55出版物引用补充资料F.X.伊万和C.K. Kwoh出版(“额外的文件5:补充表S1”)(伊凡和Kwoh, 2019年),LD50值被表示为“值”。LD50价值观反映在他们的数据集与原始出版物和一些丢失的记录被添加。此外,7个新记录从另外两个文件(施et al ., 2017)和(施et al ., 2018)记录。
2.1.1数据清理
初步数据集提出了工作(https://github.com/tengann/IAV-Host-PPI-Database/blob/main/RawData_2022.xlsm)持有488感染记录包括野生型、实验室,mouse-adapted、重组或突变IAV菌株。IAV野生型菌株的基因组在自然和non-mutated形式在实验室菌株由反向遗传学的方法。Mouse-adapted菌株来自串行lung-to-lung病毒在小鼠体内的通道。基因氨基酸序列的突变病毒是通过点突变改变了通过单一氨基酸替换。重组菌株组合形成的蛋白质片段从至少两个不同的IAV菌株。
最初的数据集是手动策划只包括记录涉及野生型或实验室IAV菌株,从而减少感染的数量为190 (补充图S1)。随后,记录包括野生型或实验室感染菌株的分类鉴定(ID)数量(或称为加入数字)(Schoch et al ., 2020)无法找到下降,进一步减少记录为166 (所示图4)。在这些情况下,是不可能检索完整的蛋白质序列IAV基因片段的吟游诗人域赋值通过2.0总科。
图4。比例的所有野生型/实验室IAV菌株分为有或没有分类ID号码,对剩余记录清理数据集(绿酒吧)。感染记录涉及野生型IAV分类ID号不能发现的地方(橙色酒吧)被省略,减少感染的数量记录到166(蓝色酒吧)。“清洁”是指139年最后一个数据集感染记录(绿酒吧)中可用IAV-Mouse PPI数据库,在每条记录对应一个独一无二的结合IAV和鼠标的压力。
最后,多个记录关于同一IAV应变和老鼠基因组被浓缩成一个单一的记录,采用的方法从F.X.伊万和C.K. Kwoh出版(伊凡和Kwoh, 2019年)。从这个过程中,感染的人数记录减少到139年(所示图4)。只要有可能,三级的多数类毒性分配方案被选中。否则,类或多或最致命被认为是。接下来,如果LD的下界50值了,最高的记录下界被选中。最低的情况准确或LD的上界50提供了价值,被选中的记录。最后清理数据集包含109独特IAV菌株用于推导出的蛋白质交互网络域。
2.2数据注释
首先,区分所有期刊出版物引用,NCBI PubMed (https://pubmed.ncbi.nlm.nih.gov/)(林德伯格2000)身份证号码唯一地分配给每个出版记录。F.X.伊万和C.K. Kwoh中收集的信息的数据集由IAV应变、鼠标应变,LD50价值和感染。然后,本文提供了一个更深层次的了解LD50价值决定在每一个独立的实验中,额外的证据,即实验方法,减肥和/或生存的言论和LD50计算方法是记录。同样,对于每个IAV应变,分类ID号,一个独特的数字代码指定分类和专业化从NCBI数据库分类检索(https://www.ncbi.nlm.nih.gov/分类)(Schoch et al ., 2020)。
蛋白质氨基酸序列IAV和鼠标从UniProt检索(释放2021 _03)蛋白质知识库(UniProtKB) (https://www.uniprot.org/)(Bairoch et al ., 2005)。IAV蛋白质序列检索使用应变名称和/或匹配分类ID号。鼠标蛋白质序列检索使用蛋白质组ID号码,UP000000589。这个参考蛋白质组的基因组序列中提取出来的C57BL / 6 j小鼠压力,与分类ID号,10090。对这项工作,55岁,315蛋白质记录,120 Swiss-Prot高仕达了条目(https://www.uniprot.org/uniprotkb?query=UP000000589)检索。Swiss-Prot审查是指记录信息完全和手动从文献中提取或curator-evaluated计算分析(Bairoch Apweiler, 1997)。它致力于提供高质量的注释与最低级别的冗余和高水平的与其他数据库的集成。
平均蛋白质包含两个或多个域、域的开始和结束残留数字,对应区域的蛋白质序列匹配每个指定的吟游诗人域(2.0总科)是独立指出每一个蛋白质序列从UniProtKB检索。因为每个领域都有其独特的结构和生物功能,只有一个子集的域构成每个蛋白质参与一对蛋白质之间的相互作用。因此,这增强了宿主-病原体蛋白质相互作用的复杂性分析(Narykov et al ., 2019)。
总的来说,IAV菌株在数据集被发现包含蛋白质域属于13个吟游诗人总科(表3)。然后,这些域配对分别与1102独特的领域中找到鼠标蛋白质序列,形成共有14个,326 IAV-mouse蛋白质域对。随后,域对DISPOT喂养作为输入,计算统计的潜力。最后,七域IAV蛋白质(用红色表示表3)和29域在小鼠蛋白质被发现参与宿主-病原体PPI的。120年的17日,鼠标蛋白质序列检索、2419独特的蛋白质被发现含有至少一个29的吟游诗人域进行交互。此外,鼠标蛋白定位在重要器官(肺、脑、肝、肾、脾和心脏)或血液是指出,随时可用。(可在补充图S2)。
3 Web服务器实现
IAV-Mouse PPI GUI web服务器理解接口,由两个页面组成,各种功能,包括浏览通过亚型和应变查看信息收集的文献搜索,一个交互式网络图伴随信息节点和边缘属性以及从UniProt中提取的氨基酸序列。图5说明了导航和布局的web服务器的GUI。
3.1工具
首先,Microsoft Excel 2016是用于存储和组织数据收集的文献。其次,代码编辑器上的web界面开发V1.71.2 Visual Studio代码,以Python V3.7.4为编程语言。Python库是熊猫V1.3.5,用于将逗号分隔值(csv)从dataframes Excel文件。Dash V2.3.1框架来设计应用程序的功能,描述如下:破折号V0.3.0引导组件来构建应用程序的布局、图形可视化组件Dash Cytoscape V0.3.0构建交互式网络图。Beautiful Soup V4.11.1 HTML解析器是用于从UniProt蛋白质序列数据库。最后,云托管应用程序中,呈现(https://dashboard。render.com/) web服务与Python web服务器网关接口HTTP服务器,Gunicorn V20.1.0是用来构建和运行web界面完全在云中。
3.2图形用户界面(GUI)
3.2.1主页
主页有一个下拉的依赖组件首先允许用户搜索一个特定IAV亚型和随后,浏览并选择病原体(s)属于所选亚型组。
3.2.2主页
三个主要sections-header主页功能,身体和页脚(所示图5 b)。
3.2.2.1头
标题部分包含两个components-pathogen标题文本组件和感染记录信息表。
3.2.2.1.1病原体头
这个文本组件显示IAV亚型,病原体名称和分类ID,根据用户的选择由主页。
3.2.2.1.2感染记录信息
本节礼物感染记录收集的信息直接从文学和附加信息收集从web工具,NCBI分类法和UniProt数据库表的形式。信息过滤,只有那些与用户相关的选择主页。
3.2.2.2身体
主体部分包括两个面板,左边的面板显示网络图和边缘属性。右边的面板分为两个部分并显示病毒和鼠标节点属性,分别。
3.2.2.2.1网络图
网络图设计,这样用户可以明显区分IAV和鼠标节点的颜色,粉色是分配给IAV蓝色节点和移动节点。用户可以通过边区分交互统计潜力,在厚边缘线代表一个高互动的可能性。同时,边缘颜色将会改变在点击蓝色,突出边缘的选择。
3.2.2.2.2节点和边的属性
节点属性包括IAV蛋白质片段或鼠标蛋白质,UniProt ID,吟游诗人总科ID、总科的名字和吟游诗人开始/结束残渣(年代)。边缘属性包括IAV和鼠标吟游诗人总科ID和名称的匹配DISPOT潜在统计分数。所有IAV节点属性将被填充在点击任何粉红色IAV节点只有鼠标吟游诗人总科ID字段将被填充在任何蓝色鼠标的点击节点网络图。同样,前者,连同其各自优势属性将在点击任何优势。显示所有鼠标节点属性,鼠标的蛋白质首先需要选择“浏览蛋白质”下拉鼠标分段节点属性。
3.2.2.3页脚
页脚为用户提供以下补充information-protein序列,路径的病毒片段和缩写。
3.2.2.3.1蛋白质序列
网页抓取应用于提取IAV和鼠标的蛋白质的氨基酸序列UniProt数据库。
3.2.2.3.2路径的病毒片段
毫无IAV蛋白质部分包括以下情况:1)UniProt ID不能被发现。因此,蛋白质序列为输入总科2.0是未知的,没有域信息能被检索。在这种情况下,UniProt ID字段是表示“没有找到”,剩下的信息被贴上“N / A”。2)有些蛋白质序列检索没有映射到任何吟游诗人总科基于总科2.0数据库。因此,没有蛋白质域DISPOT信息输入。3)IAV域信息可用,但DOMMINO数据库之间没有任何条目IAV域和17,120获取鼠标的蛋白质,因此没有交互DISPOT返回的信息。
3.2.2.3.2缩写
这部分额外的信息传递给用户;具体地说,使用缩写的定义和扩展以及指出目标,以帮助用户更好地理解网络图。
4讨论
本节列出域对识别高潜力评分交互。4.1节中针对实际验证域相互作用对蛋白质交互识别在生物化学或蛋白质组学文学。它被组织为一系列的讨论互动的功能作用域对,每段。
4.1蛋白质相互作用域
根据DISPOT分数,最强的十大领域对统计相互作用势中列出表4。
109个不同的IAV菌株提出了数据库,PB1基因段三个菌株(表5)被分配了DNA / RNA聚合酶域。然而,尽管强烈的相互作用,它是不可能确定如果DNA / RNA聚合酶的存在域对致病性的影响,由于不同IAV株毒性水平的变化。
M1基因段八IAV菌株被分配一个Methyl-accepting趋化性蛋白(MCP)信号域而不是alpha-catenin / vinculin-like。没有发现交互MCP信号域与域之间出现在鼠标的蛋白质。比较实验结果进行H3N2 IAV菌株(表6,7),尤其是在BALB / c小鼠菌株和DBA / 2,很明显,存在alpha-catenin / vinculin-like域是一个毒力因素负责IAV感染。Alpha-catenins是vinculin的蛋白质家族的成员。Vinculin actin-binding蛋白质。蛋白酶治疗表明肌动蛋白在流感病毒粒子的内部可能参与病毒组件组装移动网站和细胞骨架重组发生在芽的形成(彭et al ., 2012)。肌动蛋白是一种球状多功能蛋白家族在细胞骨架微丝。病毒的宿主细胞骨架网络参与传输组件在细胞中,主要是在病毒进入和退出阶段(肖et al ., 2008)。
Pleckstrin同源性(PH)域是一个短肽模块经常发现在细胞骨架蛋白(姚明et al ., 1999)。虽然细胞骨架元素是已知与M1,底层机制不明确(赵et al ., 2017)。Ezrin, (加入EZRI_MOUSE (UniProt号:P26040))有一个PH-like域。基于IAV的荟萃分析研究interactome M1基因段由(蔡et al ., 2022),Ezrin被发现是一个常见的关联和病毒复制是一个积极的监管机构。
UniProtKB信息表明,大多数蛋白质包含nucleotidylyl转移酶域拥有tRNA连接酶酶,或称为氨酰合成酶(ars)。ars起到至关重要的作用在蛋白质合成通过附加的氨基酸同源转移rna(图示)(聂et al ., 2019)。具体来说,Cysteine-tRNA连接酶(加入SYCC_MOUSE (UniProt号:Q9ER72)),一个很棒的NS1,催化ATP-dependent结扎的半胱氨酸tRNA(半胱氨酸)和在翻译过程中发挥作用(de Chassey et al ., 2013)。此外,ars免疫细胞的发展中起着至关重要的作用,因为他们参与成熟,转录激活,和招聘的免疫细胞。更重要的是,ars调节各种生理过程,作为信号分子在传染性疾病(聂et al ., 2019),它支持高DISPOT评分(≈4.302−)预测S15 / NS1 rna结合域的NS1段。
Ubiquitin-40S核糖体蛋白S27a, (加入RS27A_MOUSE (UniProt号:P62983)),是一种蛋白质Zn-binding核糖体蛋白域。是NS1-interacting宿主蛋白质节点,分为属于细胞凋亡通路(Thulasi喇曼和周,2016)。虽然不是核糖体所需函数,它的生命周期中扮演一个重要的角色IAV通过调节病毒核酸复制和基因转录。当中断在宿主细胞时,停止IAV的复制和传染性(李,2019)。
CCCH锌指存在于老鼠蛋白是唯一域与NS1效应S15 / NS1 rna结合域的域而不是IAV的NS1段。这个领域对DISPOT统计潜在的得分是-2.916 (圆形的到3一般。)。鼠标蛋白质、劈理和聚腺苷酸化特异性因素单元4 (CPSF4) [加入CPSF4_MOUSE (UniProt号:Q8BQZ5))包含CCCH锌指域。之间的交互NS1和CPSF4控制肿瘤蛋白质p53的可变剪接(TP53)成绩单,和改变TP53的表达并行亚型。因此,细胞先天反应,特别是通过I型干扰素分泌调控,导致有效的病毒复制(杜布瓦et al ., 2019)。
免疫球蛋白(Ig)域,否则称为抗体是唯一的吟游诗人蛋白质域与三个IAV域,即DNA / RNA聚合酶,病毒蛋白质域和唾液酸酶PB1, HA、NA段分别。免疫球蛋白是最丰富的领域中找到2419独特的鼠标蛋白质包含交互吟游诗人域(补充图S2)。在自然感染IAVs,将诱发免疫反应对血凝素和神经氨酸酶(Creytens et al ., 2021)。在原发感染IgM反应占主导地位,而免疫球蛋白反应是占主导地位的继发感染,搞笑的分泌。IgA在鼻腔分泌物可以中和IAVs血凝素和神经氨酸酶(陈et al ., 2018)。
4.2,没有相互作用蛋白质域
毫无关系的流感病毒血凝素(茎)吟游诗人的领域出现在哈是一个例子,并非所有域构成蛋白质参与相互作用的一对蛋白质。茎的发展比受体结合慢头,建议保持结构守恒的由于其作用膜融合(柯克帕特里克et al ., 2018)。研究还表明,茎域不是免疫压力下(吴和威尔逊,2020年;在佩特洛娃和罗素,2018年)。此外,突变茎域不显著影响病毒绑定或帮助避免中和抗体反应从主机(柯克帕特里克et al ., 2018)。因此一个潜在的“真正的负面”互动中还发现了蛋白质域网络,与实验结果一致。
4.3限制
一般来说,DISPOT作品作为一种工具来简化PPI预测问题通过提供有关特定ddi的可能性在一个给定的物理PPI。然而,这不是一个分类方法和统计势返回用于排名ddi但不直接转化为得分的概率。DISPOT仅仅使用蛋白质之间的相互作用域信息不应该作为一个独立的PPI预测工具来识别毒力因素负责IAV感染(Narykov et al ., 2019)。基于这项工作的结果,IAV不同菌株基因组组成高度相似的领域(即由于他们相似的结构。八段,编码至少11)和生物功能的蛋白质。此外,交互涉及到蛋白质结构不仅促进蛋白质域,还通过各种非结构化的地区,如interdomain连接器N和C末端结构或序列,蛋白质肽(旷et al ., 2012)。因此,利用DISPOT只可能产生大量的假阴性或假阳性PPI预测。
线粒体发挥必要作用抗病毒先天免疫反应通过mitochondiral antiviral-signaling蛋白质(小牛)加入MAVS_MOUSE (UniProt号:Q8VCF0)蛋白质,维生素a acid-inducible基因的一个组成部分,我(rig - I)抗病毒通路。这个途径和其他多个,是至关重要的防治和解决病毒感染,修复受损组织,产生自适应免疫反应。透露,PB1-F2抑制抗病毒细胞因子和增强炎性细胞因子的表达通过直接与小牛和其他组件的rig - i /小牛系统(Kamal et al ., 2017)。然而,随着蛋白质序列PB1-F2和小牛都没有分配任何吟游诗人域2.0总科,是不可能来验证这种交互通过DISPOT。
被DISPOT homeodomain-like域是与病毒蛋白交互领域出现在IAV的HA基因片段,统计潜在−3.203分(圆形的到3一般。)。然而一项由(Farooq et al ., 2020),它集成了两个质子泵抑制剂IAV-Mouse发现使用小型或大型研究进行实验或计算上没有发现任何证据与HA的交互。在(Farooq et al ., 2020),蛋白质同源框MOX-2 (MEOX2) [加入MEOX2_MOUSE (UniProt号:P32443)),包含homeodomain-like域,确定是与IAV交互基因片段PB1, PA, NA, M2但不是哈。相比之下,对于DISPOT homeodomain-like域之间没有交互检测段PB1和NA。同样,蛋白质序列片段PA和M2没有分配任何吟游诗人域2.0总科,DISPOT不能用来确定这些交互。此外,蛋白质的细胞本地化homeodomain-like领域被发现在细胞核中根据UniProt,表明其与哈不太可能,考虑到哈,介导细胞表面识别和病毒的条目。
此外,各地有不同的毒性水平的原因鼠标IAV菌株感染菌株的没有发现老鼠的蛋白质序列菌株从UniProt检索来自引用C57BL / 6 j小鼠品系。这个限制是由于目前整个蛋白质组序列的其他老鼠菌株(即。BALB / c, DBA / 2和FVB / J)在任何公共数据库不可用。翻译应变特定基因序列的整个蛋白质组是一个挑战性的任务需要广泛的实验工作。在这个工作中,通过实验获得这些蛋白质组蛋白质测序是不可能作为必要的材料和劳动力并不可用。
5未来的工作
弥合差距在这个工作中,基于PPI预测方法可以用来证实ddi DISPOT确认。一个例子是人类病毒蛋白质相互作用(HVPPI) web服务器,由X。杨和他的同事们(杨et al ., 2020 a)。HVPPI应用一个无监督序列嵌入技术(doc2vec)将蛋白质序列表示为丰富低维特征向量。然后,随机森林分类器训练使用训练数据集,包括已知的人类之间的质子泵抑制剂和所有病毒预测质子泵抑制剂人类病毒。最后,HVPPI web服务器自动计算概率的交互查询的蛋白质。要用作HVPPI输入的数据可以构造如下:首先,人类蛋白质序列可以获得使用老鼠和人类的同源染色体。接下来,所有蛋白质序列与吟游诗人域(s)分配给他们可以修剪,收集到的开始和结束后残留的数字。随后,将蛋白质序列可以配对相应的ddi DISPOT认可。交互概率作为预测提供输出通过为每个IAV-human HVPPI蛋白可以用来探测误报。对蛋白质序列没有分配给任何吟游诗人域,可以使用完整的蛋白质序列,这将反过来援助检测的假阴性。
作为一个扩展的工作从原始数据集,而不是忽视非标准菌株,蛋白质序列的重组或突变IAV菌株可以复制通过手动改变野生型的蛋白质序列或实验室IAV菌株在UniProt可用。这进一步丰富了数据集。
DISPOT统计势,HVPPI交互概率和LD50值可以包含代表PPI网络加权无向图。之后,图嵌入方法可以应用到这个加权图学习低维节点表示(悦et al ., 2020)。PPI的结构信息,如程度、位置和邻近的节点图已经承认在PPI有用的预测(杨et al ., 2020 b)。
6结论
IAV是一个重大威胁全球人类健康和生活,关键是有更深层次,准确和可靠的见解和知识上的毒力因素负责IAV感染来抵消潜在的爆发(伊凡和Kwoh, 2019年)。这项工作建立在之前策划致死剂量研究的数据集IAV感染的老鼠。此后,总科域参与ddi IAV和老鼠之间发现,和排名根据DISPOT统计计算相互作用势。一站式集成web服务器从文献整理的信息和各种数据库,即NCBI分类,UniProt和总科2.0 DDI网络构建。此外,web服务器是可伸缩的,可以无缝地适应增加新的功能和数据在未来的研究。
数据可用性声明
在这项研究中提出的数据集可以在网上找到存储库。库的名称/存储库和加入号码可以找到(s)如下:https://iav-ppi.onrender.com/homehttps://github.com/tengann/IAV-Host-PPI-Database。
作者的贡献
TN和SR的构思和设计方法。TN的方法实现。TN和老写的手稿。CK监督整个概念、设计、实现和写作阶段。所有作者进行审核和批准最终的手稿。
资金
这项工作是由教育部(MOE)赠款moe2019 - t2 - 2 - 175和moe2020 - t1 - 001 - 130,新加坡。
确认
作者感谢F.X.伊凡构建感染的初始数据集记录被用来开发这里的毒性网络。他们也感谢以下财团的数据库和程序:NCBI PubMed和分类,UniProt,总科2.0和DISPOT。
的利益冲突
作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。
出版商的注意
本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。
补充材料
本文的补充材料在网上可以找到:https://www.雷竞技rebatfrontiersin.org/articles/10.3389/fbinf.2023.1123993/full补充材料
引用
Alborzi, s . Z。该,A。纳贾尔,H。,Ritchie, D. W., and Ppidomainminer, M. D. D. (2021). Inferring domain-domain interactions from multiple sources of protein-protein interactions.公共科学图书馆第一版。医学杂志。17 (8),e1008844。doi: 10.1371 / journal.pcbi.1008844
Ammari, m·G。,Gresham, C. R., McCarthy, F. M., and Nanduri, B. (2016). Hpidb 2.0: A curated database for host–pathogen interactions.数据库2016年,baw103。doi: 10.1093 /数据库/ baw103
Andreeva,。,Howorth, D., Brenner, S. E., Hubbard, T. J., Chothia, C., and Murzin, A. G. (2004). Scop database in 2004: Refinements integrate structure and sequence family data.核酸Res。226 d - 229 d。doi: 10.1093 / nar / gkh039
Bairoch,。,和Apweiler, R. (1997). The swiss-prot protein sequence data bank and its supplement trembl.核酸Res。25 (1),31-36。doi: 10.1093 / nar / 25.1.31
Bairoch,。,Apweiler, R., Wu, C. H., Barker, W. C., Boeckmann, B., Ferro, S., et al. (2005). The universal protein resource (uniprot).核酸Res。33岁的D154-D159。doi: 10.1093 / nar / gki070
陈,X。,Liu, S., Goraya, M. U., Maarouf, M., Huang, S., and Chen, J. L. (2018). Host immune response to influenza a virus infection.前面。Immunol。9日,320年。doi: 10.3389 / fimmu.2018.00320
蔡,s . c . j . H。崔,J。,Engelberg, D., and Lim, L. H. K. (2022). A review and meta-analysis of influenza interactome studies.前面。Microbiol。13日,869406年。doi: 10.3389 / fmicb.2022.869406
做饭,h V。,Doncheva, N. T., Szklarczyk, D., von Mering, C., and Jensen, L. J. (2018). Viruses.STRING: A virus-host protein-protein interaction database.病毒10(10),519年。doi: 10.3390 / v10100519
Creytens, S。,Pascha, M. N., Ballegeer, M., Saelens, X., and de Haan, C. A. M. (2021). Influenza neuraminidase characteristics and potential as a vaccine target.前面。Immunol。12日,786617年。doi: 10.3389 / fimmu.2021.786617
de Chassey B。,Aublin-Gex, A., Ruggieri, A., Meyniel-Schicklin, L., Pradezynski, F., Davoust, N., et al. (2013). The interactomes of influenza virus ns1 and ns2 proteins identify new host factors and provide insights for adar1 playing a supportive role in virus replication.公共科学图书馆Pathog。9 (7),e1003440。doi: 10.1371 / journal.ppat.1003440
Dubois, J。,Traversier, A., Julien, T., Padey, B., Lina, B., Bourdon, J. C., et al. (2019). The nonstructural ns1 protein of influenza viruses modulates tp53 splicing through host factor cpsf4.j .性研究。93 (7),021688 - e2218。doi: 10.1128 / jvi.02168-18
Farooq,问:美国。、Shaukat Z。并,S。周,T。,和Li, C. (2020). A systems biology-driven approach to construct a comprehensive protein interaction network of influenza a virus with its host.BMC感染。说。20 (1),480。doi: 10.1186 / s12879 - 020 - 05214 - 0
Itzhaki, Z。Akiva E。,Altuvia, Y., and Margalit, H. (2006). Evolutionary conservation of domain-domain interactions.基因组医学杂志。7 (12),R125。doi: 10.1186 / gb - 2006 - 7 - 12 - r125
Iuliano, a D。,Roguski, K. M., Chang, H. H., Muscatello, D. J., Palekar, R., Tempia, S., et al. (2018). Estimates of global seasonal influenza-associated respiratory mortality: A modelling study.《柳叶刀》391年,101271285 - 101271300。doi: 10.1016 / s0140 - 6736 (17) 33293 - 2
伊凡,f . X。,和Kwoh, C. K. (2019). Rule-based meta-analysis reveals the major role of pb2 in influencing influenza a virus virulence in mice.BMC基因组学20 (9),973。doi: 10.1186 / s12864 - 019 - 6295 - 8
约翰逊:p·a·S。,和米ueller, J. (2002). Updating the accounts: Global mortality of the 1918-1920 "Spanish" influenza pandemic.公牛。嘘。地中海。76 (1),105 - 115。doi: 10.1353 / bhm.2002.0022
荣格,h·E。,和Lee, H. K. (2020). Host protective immune responses against influenza a virus infection.病毒12(5),504年。doi: 10.3390 / v12050504
Kamal, r . P。,Alymova, I. V., and York, I. A. (2017). Evolution and virulence of influenza a virus protein pb1-f2.Int。j .摩尔。科学。19 (1),96。doi: 10.3390 / ijms19010096
柯克帕特里克,E。秋,X。,Wilson, P. C., Bahl, J., and Krammer, F. (2018). The influenza virus hemagglutinin head evolves faster than the stalk domain.科学。代表。8 (1),10432。doi: 10.1038 / s41598 - 018 - 28706 - 1
旷,X。,Han, J. G., Zhao, N., Pang, B., Shyu, C. R., and Korkin, D. (2012). Dommino: A database of macromolecular interactions.核酸Res。D501-D506。doi: 10.1093 / nar / gkr1128
陆,X。,Tumpey, T. M., Morken, T., Zaki, S. R., Cox, N. J., and Katz, J. M. (1999). A mouse model for the evaluation of pathogenesis and immunity to influenza a (h5n1) viruses isolated from humans.j .性研究。73 (7),5903 - 5911。doi: 10.1128 / jvi.73.7.5903 - 5911.1999
Masemann D。路德维希,S。,和Boergeling, Y. (2020). Advances in transgenic mouse models to study infections by human pathogenic viruses.Int。j .摩尔。科学。21日(23日),9289年。doi: 10.3390 / ijms21239289
Narykov, O。,Bogatov, D., and Korkin, D. (2019). Dispot: A simple knowledge-based protein domain interaction statistical potential.生物信息学35 (24),5374 - 5378。doi: 10.1093 /生物信息学/ btz587
聂,。,Sun, B., Fu, Z., and Yu, D. (2019). Roles of aminoacyl-trna synthetases in immune regulation and immune diseases.细胞。死亡说。10(12),901年。doi: 10.1038 / s41419 - 019 - 2145 - 5
Pandurangan, a P。Stahlhacke, J。欧茨,m E。史密瑟斯,B。,和Gough, J. (2019). The superfamily 2.0 database: A significant proteome update and a new webserver.核酸Res。47 (D1) D490-D494。doi: 10.1093 / nar / gky1130
彭,X。,米aiers, J. L., Choudhury, D., Craig, S. W., and DeMali, K. A. (2012).α连环蛋白激活vinculin使用一个新颖的机制。生物。化学。287 (10)7728 - 7737。doi: 10.1074 / jbc.m111.297481
佩特洛娃,v . N。,和Russell, C. A. (2018). The evolution of seasonal influenza viruses.启Microbiol Nat。16 (1),47-60。doi: 10.1038 / nrmicro.2017.118
罗杰斯(1968)。“流感”大英百科全书。15日版(美国芝加哥,伊利诺斯州:百科全书公司。)。勾选:https://www.britannica.com/event/1968-flu-pandemic。
Sarkar, S。,和Heise, M. T. (2019). Mouse models as resources for studying infectious diseases.中国。其他。41 (10),1912 - 1922。doi: 10.1016 / j.clinthera.2019.08.010
Schoch, c . L。、Ciufo年代。,Domrachev, M., Hotton, C. L., Kannan, S., Khovanskaya, R., et al. (2020). Ncbi taxonomy: A comprehensive update on curation, resources and tools.数据库(牛津)2020年,baaa062。doi: 10.1093 /数据库/ baaa062
肖,m . L。,Stone, K. L., Colangelo, C. M., Gulcicek, E. E., and Palese, P. (2008). Cellular proteins in influenza virus particles.公共科学图书馆Pathog。4 (6),e1000085。doi: 10.1371 / journal.ppat.1000085
施,J。,Deng, G., Kong, H., Gu, C., Ma, S., Yin, X., et al. (2017). H7n9 virulent mutants detected in chickens in China pose an increased threat to humans.细胞。Res。27 (12),1409 - 1421。doi: 10.1038 / cr.2017.129
施,J。,Deng, G., Ma, S., Zeng, X., Yin, X., Li, M., et al. (2018). Rapid evolution of h7n9 highly pathogenic viruses that emerged in China in 2017.细胞。主机的微生物24 (4),558 - 568。doi: 10.1016 / j.chom.2018.08.006
不要,m . C。,Russell, C. D., Harrison, E. M., Docherty, A. B., Lone, N., Girvan, M., et al. (2022). Sars-cov-2 co-infection with influenza viruses, respiratory syncytial virus, or adenoviruses.《柳叶刀》399年,103341463 - 103341464。doi: 10.1016 / s0140 - 6736 (22) 00383 - x
Thulasi拉曼,s . N。,和Zhou, Y. (2016). Networks of host factors that interact with ns1 protein of influenza a virus.前面。Microbiol。7日,654年。doi: 10.3389 / fmicb.2016.00654
Viboud C。,Simonsen, L., Fuentes, R., Flores, J., Miller, M. A., and Chowell, G. (2016). Global mortality impact of the 1957-1959 influenza pandemic.j .感染。说。213 (5),738 - 745。doi: 10.1093 / infdis / jiv534
吴:C。,和Wilson, I. A. (2020). Structural biology of influenza hemagglutinin: An amaranthine adventure.病毒12 (9),1053。doi: 10.3390 / v12091053
杨,F。,Fan, K., Song, D., and Lin, H. (2020a). Graph-based prediction of protein-protein interactions with attributed signed graph embedding.BMC Bioinforma。21 (1),323。doi: 10.1186 / s12859 - 020 - 03646 - 8
杨,X。,Yang, S., Li, Q., Wuchty, S., and Zhang, Z. (2020b). Prediction of human-virus protein-protein interactions through a sequence embedding-based machine learning method.第一版。结构体。Biotechnol。J。18日,153 - 161。doi: 10.1016 / j.csbj.2019.12.005
姚明,L。,Janmey, P., Frigeri, L. G., Han, W., Fujita, J., Kawakami, Y., et al. (1999). Pleckstrin homology domains interact with filamentous actin.生物。化学。274 (28),19752 - 19761。doi: 10.1074 / jbc.274.28.19752
悦,X。,Wang, Z., Huang, J., Parthasarathy, S., Moosavinasab, S., Huang, Y., et al. (2020). Graph embedding on biomedical networks: Methods, applications and evaluations.生物信息学36 (4),1241 - 1251。doi: 10.1093 /生物信息学/ btz718
关键词:甲型流感致死剂量50、蛋白质、毒性、小鼠模型,domain-domain交互
引用:Ng助教,拉希德和Kwoh CK(2023)毒性的相互作用网络域的甲型流感和鼠标的蛋白质。前面。Bioinform。3:1123993。doi: 10.3389 / fbinf.2023.1123993
收到:2022年12月22日;接受:2023年2月3日;
发表:2023年2月17日。
编辑:
陈莉、莫纳什大学、澳大利亚版权©2023 Ng,拉希德和Kwoh。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。
*通信:齐川阳Keong Kwoh,asckkwoh@ntu.edu.sg