跳转到主要内容

原始研究的文章

前面。系统。医学杂志。,26 October 2022
秒。系统和合成免疫学
卷2 - 2022 | https://doi.org/10.3389/fsysb.2022.1022486

R400:一种新型基因签名在辐射剂量的预测研究人类

  • 圣弗朗西斯泽维尔大学计算机科学系Antigonish, NS,加拿大

辐射对生物有机体的有害影响一直是研究通过主要评估病变细胞,组织或器官。最近,有更容易辐射研究相关的基因表达数据集。这提供了一个机会来分析反应在分子水平上揭示表型差异。生物标志物在toxicogenomics建议指标的辐射和不同剂量的辐射似乎有不同的反应。本研究提出了一个预测基因签名特定辐射,可用于自动诊断照射剂量。在寻找一个可靠的基因集,能够正确识别照射剂量,需要考虑集合的大小。出于这个原因,我们尝试用基因的数量用于训练和测试。基因集大小的28,100,200,300,400,500,600,700,800年、900年和1000年进行了测试,发现尺寸在三个数据集提供了最好的准确性。模型被训练和测试使用多个数据集以各种方式,包括外部验证。这些数据集之间的异同提供一个模拟现实世界的情况,来自多个数据源的数据格式可能有差异,设置、时间参数、参与者,流程,和机器的公差,所以一个健壮的训练数据集从许多不同种类的样品应该提供更好的可预测性。所有三个数据集显示阳性结果的正确分类辐射照射剂量。 The average accuracy of all three models was 88% for gene sets of both 400 and 1,000 genes. R400 provided the best results when testing the three datasets used in this study. A literature validation of top selected genes shows high relevance of perturbations to adverse effects reported during cancer radiotherapy.

介绍

我们四周到处是辐射来自大自然和人类的来源。辐射的研究过去75几年的纵向研究的广岛和长崎幸存者,核事故,放射学工作者和科学家、太空旅行、核医学产生了大量的数据(拉康姆猪et al ., 2018)。这种诊断方法可用于测试大量的人暴露在一个自然或人为灾害及时质量辐射暴露。当前黄金标准电离辐射诊断具双着丝的染色体化验(DCA),但是这需要时间和专业知识来完成每个样本(Ostheim et al ., 2022)。这意味着吞吐量受到临床医生能力的可用性。样品需要前往实验室手册检查结果需要传达到分流中心增加延迟时间敏感的诊断和治疗。确定一组最佳剂量预测基因可以帮助开发一个具有成本效益的,高通量检测系统用于人口暴露允许更快的分类根据剂量(Broustas c . g . et al ., 2017;Biolatti et al ., 2021)。

在本研究中,浓度是寻找诊断生物标记物,这些特征表明一种疾病的存在或疾病的亚型。这些特征,如基因表达,表明暴露于电离辐射(Ghandhi et al ., 2015)。许多生物标志物toxicogenomics已经提出和研究的想法,这些生物标记物可以提供证据的辐射照射剂量,时间和类(西蒙,2011)。辐射生物标志物的研究已经确定了损伤由于接触(豪et al ., 2021年,p . 4)。文献综述中标识的基因数量变化研究(Shuryak et al ., 2020)(Panera et al ., 2021)。尽管这些研究在各种不同的环境和因素(如物种),一些常见的生物标志物被发现在研究已经表明有一个可测量的辐射暴露。已经有研究确定辐射敏感基因(Broustas CG。et al ., 2017))。在这项研究中,我们研究的基因数量是否用于预测签名模型的精度的影响。我们也看着这机器学习分类器执行最好的跨基因组大小和数据集。然后我们测试合并数据集,训练样本更异构,并将模拟添加各种真实的样品建立一个更健壮的诊断模型。最后,我们使用两个不同的数据集训练模型,然后在第三个数据集测试模型的样本。

识别受影响的基因并研究其反应暴露剂量可能提供的方法预测未来健康结果通过连接已知疾病的特定基因和细胞通路。基因表达生物标记物是受不同的毒素和畸变出现后迅速曝光。环境因素如化学物质可以与基因相互作用,导致基因的产量变化。有时基因是上调的化学物质和生产增加(或者相反)(豪et al ., 2021)。这些表情的变化是在这项研究中使用的生物标志物发现的基因组合的签名(Ghandhi et al ., 2015)。自生物标记物应该能够被用来确定辐射的剂量,治疗可以规定将尽早开始时是最有效的。由于基因表达的速度之快,诊断可以在症状出现之前完成。一个事件可能导致不同剂量在其主题,所以方法需要快速识别每个人的剂量。剂量的确定也可以影响治疗快速诊断是很重要的。质量曝光事件需要筛选,以便适当的治疗可以应用于个人。由于专业知识和实验室空间需要当前的黄金标准,诊断手段使用高通量方法将有助于分类受害者,这样他们就可以得到最好的治疗方法。基因检测可以在此类事件,以便可以进行快速诊断,和适当的治疗方法适用于每个人。

提出了一个预测基因签名,它是特定于辐射,可用于自动诊断的照射剂量。有一个健壮的训练数据集从许多异构的样品应该提供更好的可预测性在广泛多样的人口。我们的研究集中在样品暴露在x射线,β和γ射线类型的辐射。确保最包容的模型构建基因将敏感反应跨不同人群,广泛的样本所有人口和地理位置应该用于培训。下载的数据集在这项研究是基于辐射及其对基因表达的影响,发现在基因表达综合(GEO) (www.ncbi.nlm.nih.gov地理)。分析这些基因结合反应的不同水平的辐射接触识别预测签名的承诺。本文发现,机器学习模型训练的签名组基因的表达式可以提供准确的预测剂量的辐射。一组基因签名是为此目的而开发的,叫做R400。一个签名还开发了大量的基因称为R1000 R400基因集扩展到包括1000个基因。为每一个签名中列出的基因补充表S4, S5分别。三种数据集:GSE90909、GSE58613 GSE65292。这三个数据集显示阳性结果的正确分类剂量的辐射。每个模型的准确性为91%,74%,100%。这三个模型的平均精度为88% R400和R1000基因的基因集。在这项研究中使用的所有脚本和程序是可用的在线在GitHub上https://github.com/Howaboutthis1/R400

材料和方法

地理数据集

从基因表达综合(GEO), GSE90909, GSE58613, GSE65292数据集(见表1)下载使用。疾病基因相关计划建造和GSE90909数据集上运行。

表1
www.雷竞技rebatfrontiersin.org

表1。总结数据集用于R400基因集的选择。

GSE90909[12288个基因,51个样本(只有x射线样本选择)]是建立在一个暴露的血液样本的研究不同剂量的辐射体外。有12种不同的人类健康的捐赠者(6 6雌性和雄性),共92个样本中包含的数据集(Broustas CG。et al ., 2017))。

GSE58613[21225个基因;53个样品(只有健康的样本选择)]包含样本健康的人类和人类各种疾病,年龄在21 - 66。一些样品在辐照体外和一些被全身辐照后执行。前后血液样本被病人接受放射治疗。不同曝光剂量和长度的时间因为辐照用于最初的研究(卢卡斯et al ., 2014)。

GSE65292[12073个基因;35个样本)基因表达数据为人类辐照血液样本体外与各种各样的剂量。辐射应用于两个剂量率表示为“急性”和“低”(Ghandhi et al ., 2015)。

考虑几个数据集的目的是预测是否能诊断照射剂量使用特定的基因表达特征,我们称之为R400。此外,最近的研究表明,某些基因在不同剂量不同响应。拉康姆猪等人表示,需要组合而不是单个的生物标记,需要更多的研究来克服差异研究的协议和方法(拉康姆猪et al ., 2018)。在这项研究中使用的三个数据集有限的人口信息。扩大和增加数据集的训练集的样本不同人群应该改善效果在不同人口统计数据。

提出了框架

图1显示了本文中概述的步骤的工作流程。第一阶段包括清洁和准备数据集的特征选择导致每个基因的相关性得分。这使得各种基因集的大小是由基因在研究和测试。

图1
www.雷竞技rebatfrontiersin.org

图1。本文给出了工作流。

第二阶段训练模型与不同的基因集大小和不同的分类器模型使用5倍交叉验证。测试精度是用来选择最好的模型预测能力的外部验证通过结合数据集在阶段3。

第三阶段是外部验证执行,这样两个数据集处理如前所述,合并成一个训练集,第三个数据集被用来测试模型。GSE90909以来被选为测试集的剂量范围在每个剂量范围内的其他两个数据集和它的模型显示在单个数据集测试期间准确的预测。原始数据准备,特征选择是考虑到每个基因选为一个功能必须出现在所有三个数据集。接下来,合并两个数据集,规范化,用来训练一个分类器模型。第三集,用于培训,规范化,并测试剂量的分类器的预测。

原始数据预处理

原始数据集被导入到R使用Bioconductor Biobase, GEOquery包。基因表达样本提取时,一些培训和测试所需的数据并不包括在机器可读的格式。每个样品必须被添加的剂量,使分类器可以学到的剂量被暴露在每个样本。基因化验有时使用探头名称而不是基因符号来识别每个基因的表达。因此,基因名字映射和从每个数据集的元数据中提取可读性在基因选择和测试结果。从基因表达数据集进口混合(GEO)在原始格式存储库,需要格式化的剂量,样本基因名称和id数据集之间的排列。三个数据库都留给尽可能触及了此时唯一的变化与剂量的测量cGy(厘戈瑞)(cGy)灰色(Gy)他们除以100。这样做的好处是,在每个数据集分类器将评估剂量相同的规模。表达数据进一步由取代任何NAs与平均每个基因的表达。剂量数据转化为数值和添加到每个样本的基因表达的机器学习培训和测试步骤。

GSE90909包含样品暴露在x射线和中子辐射。这个数据集的剂量范围从0到4 Gy。辐射类型一致性数据集,只有x射线和控制样本提供51样品用于测试。GSE58613包含样本健康和全身照射(TBI)个人要么没有得到治疗,粒细胞集落刺激因子(g - csf)和脂多糖(LPS)的治疗方法。辐射源是铯- 137 (Cs137)发出β和γ射线。这个数据集的剂量范围从0到600 cGy被转化为0 - 6 Gy剂量其他两个数据集的规模相匹配。仅供一致性数据集健康、摘要样本导致26个样品用于测试。所有的样品在GSE65292使用。有35个样品剂量范围从0到4.45 Gy。使用x射线辐照器辐射应用。

基因排序和选择

为本研究选择的三个数据集有12288个基因(GSE90909), 22277个基因(GSE58613), 12073个基因(GSE65292)。包括大量的基因将限制适用性高通量辐射测试尤其是当许多基因无电抗。此外,包括更多的基因(或特性)会影响机器学习(ML)算法的性能(Soufan et al ., 2015)。因此,我们的基因数量减少使用皮尔森的相关方法,表明改进的性能在基因表达数据集(Soufan et al ., 2015;Spainhour et al ., 2019)。皮尔森相关法是用来给所有的基因通过计算每个基因的相关性分数允许dose-correlated基因进行排序和选择。这些分数被用于选择一组基因,然后执行评估使用机器学习模型。外部验证,发现的基因相比,基因中列出当前文学和剂量反应验证了使用fastBMD (www.fastbmd.ca),在线基准剂量分析服务,接受地理数据集符合他们的标准文件格式(埃瓦尔德et al ., 2021)。不同的基因集大小找建模的最佳规模最好的预测精度。选择基因在GSE90909相关性分数高于0.80定义28基因作为候选预测生物标志物。其他测试基因集大小是100,200,300,400,500,600,700,800年、900年和1000年的相关基因在每个数据集。

相关分析的基因剂量用于排序的所有基因特征选择。只包含在所有三个基因包括本研究中使用的数据集。确定最优基因集大小、机器学习是运行在Matlab的分类器应用程序使用内置的分类器类型的15和5倍交叉验证当训练。这样做是基因集合大小的:28日,100年,200年,300年,400年,500年,600年,700年,800年、900年和1000年。两个数据集分别用来确定最佳基因集大小在数据集使用验证精度。ML模式类型与最好的结果导出,用于测试未知数据集模型two-dataset训练集训练。线性判别分类器通常获得最好的结果,被选为70/30的模型类型分离实验。

剂量的机器学习分类预测

出发前,以确定最优基因集大小,最好的模型类型需要发现模型测试。回顾过去的toxicogenomics文献显示1000个基因已成功用于特征选择等剂量反应模型在T1000和L1000 (Soufan et al ., 2019)。发现所使用的模型类型,我们测试了15基因11日机器学习模型类型设置大小。列出了机器学习模型类型排序表(补充表S3)的补充文件。基因集大小的28,100,200,300,400,500,600,700,800,900,1000被用于每个15模型的训练和测试类型分别使用两种不同的数据集。总的来说,330模型被建立。所有的训练是通过使用5倍交叉验证和培训结果列表的补充文件(补充表S3)。Matlab是线性判别分类器(LDA)通常有最好的训练精度验证跨基因组大小。

绩效评估和实验设置

每个模型的性能评估是通过观察测试样品的正确预测百分比。精度= #正确预测/ #测试案例(#正确的预测=数量的预测,预测标签匹配实际剂量)。模型的预测正确匹配的实际剂量或他们没有。正确地匹配预测算为真阳性(TP)。没有真正的底片(TN)对于所有预测精度计算摘要TN = 0。

每个模型的结果总结了多层次混淆矩阵是一个表组成的两个轴:一个轴模型的预测剂量和一个轴的实际剂量样品。使用相同的剂量类,命令两个轴,以便预测和实际剂量对角线相交。当预测剂量正确归类为实际的剂量,他们满足的相应细胞混淆矩阵的对角线细胞从顶部,左边角落,右边则代表了正确预测样本。

使用边界决定最好的识别分类模型离散剂量类。这使得预测精度的计算基于正确的数量(对角线)和错误(对角线)预测剂量。

评价1:内部测试设置

每个数据集的样本分为训练集和测试集30% 70%。然后,5倍交叉验证每个训练集被处决。交叉验证被用来提高毫升模型的内部参数。30%的分区模型进行测试,显示了每个实验的精度表2。我们应用这种测试分别设置在所有三个数据集和报告结果。

表2
www.雷竞技rebatfrontiersin.org

表2。平均多毫升模型的精度。

2:评估外部测试设置

我们考虑过一个不同的模型的测试设置为外部验证。自整体线性判别模型提供了最好的结果在这个研究(补充表S3),它被用来训练模型在两个数据集的组合和报告结果在第三集。两个数据集相结合提供的最高范围覆盖剂(0胜Gy)。然后,第三集是用于测试。之所以选择它,是因为它的所有剂量的剂量范围内的联合数据集。我们报告性能使用单独的测试分数和认为这是一个外部模型的验证。

R400 R1000建设

R400和R1000由拉相关性分数最高的前400和1000个基因中存在的所有三个数据集。然后由相关的基因被命令排名根据GSE90909的秩序。GSE90909作为测试数据集使用另外两个数据集构建的模型。的结果表2表明GSE90909有八个排名前十的测试精度。最好的精度不是从GSE90909 GSE58613在400个基因(87%)和GSE90909第二最好的分数是使用400个基因(93%)。的整体精度模型使用400个基因表现优于其他基因构建组大小。应该注意的是,高精度还指出基因集大小的700年和800年但个人数据精度的集没有高达400个基因(表2;图2)。与病人的样品可能发生的一个问题是,它可能不包含所有的基因中发现R400所以更大的基因集,称为R1000,创建。它包含R400 + 600多个基因,这样上面的400个基因中发现病人的样本可以从R1000进行测试。

图2
www.雷竞技rebatfrontiersin.org

图2。图的精度在70%和30%的测试模型的训练数据集。

结果

剂量反应的预测结果

我们已经完成330实验使用涉及11个基因15个分类器组大小。对于数据集1,线性判别分类器(LDA)实现最高精度9/11 (82%)。对于数据集2,LDA精度最高4/11 (36%)。对于每个数据集,LDA通常精度最高。这两个数据集的平均测试结果达到了最高90%的400个基因(图2)。由于这些原因,基因集大小的400年和1000年决定测试模型建立在多个数据集和测试数据集没有用于培训。确认初步测试结果,Matlab与5倍交叉验证的线性判别分类器是用于所有x射线和控制GSE90909样品。所有健康,以及控制样本GSE58613用于第二个模型和所有的样本GSE65292用于第三个模型。两个数据集相结合的训练和分区测试30% / 70%。结果表明承诺,因为附近有一个明显的集群混淆矩阵的对角线(正确的预测图3一)。公差是否增加,能够提高准确率从61.3%到96.8%的感染邻近细胞混淆矩阵(图3 b)。这是合理的,因为这两个数据集在他们的数据有差异。

图3
www.雷竞技rebatfrontiersin.org

图3。混淆矩阵的联合数据集1 & 2。面板(一)显示了一个严格的准确性61.3%,TP预测匹配正确的类。面板(B)允许一个预测土地毗邻这样类以TP计算的准确性高达96.8%。扩大允许细胞的宽容是合理的因为数据集有不同剂量类。即。,Dataset 3 has no 0.3 class but it does have a 0.25 class.

分析基因集的大小

毫升分类器的精度预测在这个研究表明一个预测基因签名诊断剂量的接触一个样本有可取之处和基因用于基因签名的数量分类器模型的预测精度的影响。似乎有一个最优的基因数量增加预测的准确性。尽管结果有差异的基因集大小改变,他们通常在增加400个基因。这是在分类器选择阶段和70年的火车/ 30测试运行。测试精度GSE90909 400个基因分别为93%,87%,GSE58613 (图2)。随着数据集变得更加异构混合两个数据集,400个基因模型的准确性为48%。精度下降进一步当测试样本的数据集不包含在模型训练(图4)。测试精度的混合数据模型有一个狭窄的范围20% - -22%的基因集大小。培训验证精度,然而,凤头曲线从200年的80%以上(83.6%)的基因400个基因(80.3%)和打击最大的300个基因(85.2%)(补充表S2)。本研究结果发现在支持一个优化的建议基于400个基因的基因签名。我们叫这组基因R400。

图4
www.雷竞技rebatfrontiersin.org

图4。混淆矩阵的剂量预测模型训练数据集1 & 2,然后测试数据集3。

模型能够预测的剂量暴露在训练数据集。虽然精度不同的整个范围的实验表现在这项研究中,有一个潜在趋势的每个模型的可预测性。精度下降的复杂性被添加到实验。在这项研究中,我们发现,400个基因在GSE90909和GSE58613提供最好的结果。在700个基因,GSE90909(本身)获得测试精度最高的100%,但58613 GSE得分40%,平均70%。在400个基因,他们得分分别为93%和87%,平均90%,是最好的性能(表2)。

预测剂量从一个数据集上使用多个其他数据集使用构建评价模型2

诊断模型是有用的,它必须能够诊断样本,不是从一个已知的数据集,它必须能够集成不同的数据集的训练。为了测试这样一个模型将取得良好的成果,multiple-dataset模型构造。这一次,这两个数据集GSE58613 GSE65292规范化,结合Matlab用于机器学习分类器训练。数据集GSE90909规范化,用于测试模型。这三个数据集被分别归一化,然后两个数据集的总和。

1、2点的组合数据集作为训练集用于机器学习分类应用Matlab的模型验证结果记录和导出模型。该模型用来预测剂量的第三样本数据集。多基因集大小进行了测试,从28 - 1000。测试集测试模型时,剂量可以提高预测如果正确检测对角再次扩大赶上相邻细胞的混淆矩阵的剂量诊断(图4)。领域,提高可用性,当训练数据集可能没有见过类似于未知样品,样品测试。预测似乎有一个切线,似乎暗示着一种偏见或扭曲的结果(补充数据S2-S4),应该可以解释这样的预测能力保持在范围广泛的病人。这个线性扭曲/偏差显示一组线性关系这种基因的剂量线性回归是使用Matlab完成。

线性回归模型训练相结合,归一化数据集的GSE58613和GSE65292毫升的用于训练分类模型。然后GSE90909未知样本进行了测试在两个模型使用R400构建和R1000。均方根误差(RMSE)的测试结果R400略优于R1000和块预测与实际剂量似乎显示倾斜或偏见之间的数据集,因为绘制数据所有落在类似的线性聚集模式左边的正确预测对角线(补充图S4)。

讨论

本文的工作目的是是否可以开发一个特定的测试或试验诊断剂量的电离辐射暴露样本有效而准确地从不同的情况和位置。我们寻找一个优化的基因最好的可预测性。有一组优化基因大小将允许辐射剂量预测特定试验设备开发,这样机器学习模型可用于高通量诊断专家考试的地方。我们总共有2475实验(即运行。,15models x 5folds x 11gene sets x 3datasets) with gene set sizes of 28, 100, 200, 300, 400, 500, 600, 700, 800, 900, and 1,000 across three datasets. For such models to be as accurate as possible, they will need to be trained using as wide of a population base as available to have the best real-world matching heterogeneity. For this study only genes that were included in all three datasets were considered candidates for the R400/R1000 signatures so that the machine learning models would not have any missing features’ values for training or testing. There appears to be an optimized size of the gene set used in machine learning for radiation exposure dose prediction. Preliminary reduction of a gene set size from 12,288 to 28 genes, selected for correlation scores above 0.80, resulted in improved prediction accuracy from 51.9% to 94.2%. The optimum number of genes seems to peak between 400 and 800 genes depending on the dataset used. Data across studies have variations in the experiments that can cause results from one study to have dissimilarities in datasets from a similar study. Things such as equipment differences, procedures, and donor population sampling can make similar biological reactions have differently recorded results compared to results from other studies. For this reason, a specific gene set used in multiple studies can provide differing results. This study found an optimal ordered gene set comprised of the 400 top selected genes which we call R400. Since some samples presented for testing may not contain all genes in R400 and because predictive accuracy also peaked at 800 genes (图2),创建一套基因1000个基因,我们称为R1000。因此,R400 R1000的子集;它是由R1000的前400名获得基因。我们认为很重要,因为这两个基因集精度达到数量接近400基因和再次接近1000个基因。基因集合的顺序影响模型的准确性。这意味着建立在R400模型的准确性会有最好的结果,如果保持基因的顺序中列出补充表S4。这同样适用于R1000提供补充表S5

本文最初选择的基因集大小被限制包含只有28基因皮尔逊相关性得分> 0.80。大部分的文学发现辐射影响特定基因上市2 - 6基因是接触反应。其他toxicogenomics研究已经缩小的基因数量到1000年和1500年(萨勃拉曼尼亚et al ., 2017)。早些时候,我们报道T1000和更好的结果说明基因设置大小为1000 (Soufan et al ., 2019)。进一步,我们分组探索这些基因和总结表达成模块支持决定如果化学接触有毒或无毒(埃瓦尔德et al ., 2021,2020年)。同样,本研究还发现更高的精度,包括1000个基因(图2;表2)。

在这项研究中,瑞士银行的样本的增加,预测变得不那么准确。例如,当合并两个数据集来创建一个更大、更多样化的数据集,精度下降(表2)。更低精度被模型训练时在一个或多个数据集,然后另一个数据集的样本用于测试。即便如此,预测似乎保持直,对角线模式,但从左转到对角倾斜(图4)。

机器学习可以预测样品的剂量的辐射暴露在不同的数据集使用相同的基因集。每个基因集大小的平均精度达到79%,R800为76%,R400 (表2)。当模型训练在一个或两个数据集,它能够预测样本数据集不是剂量使用的培训。精度下降,当创建一个新的数据集是用于模型从其他数据集,但结果仍显示预测能力强时考虑了离散性质的分类模型,该模型可能没有一个特定的类样本的实际剂量。允许,公差可以增加接受预测对角线附近(图3)和剂量措施可以扩展,邻近分类可以组合在适当的时候。例如,一个剂量的0.56 Gy最近的类可用的模型的实际剂量0.50 Gy在被测样品。零用钱可以这里的可预测性诊断仍然是相关和有用的在这一点上。在确定测试的准确性,预测和实际之间的差异的大小剂量被认为是。

这里提出的预测模型的局限性来自它所依赖的训练数据。变化的条件和设置样本收集可以在模型的精度有很大的影响。人口变化和可用的有限数量的样本也限制了模型的鲁棒性。如果提交一个样本进行测试,非常不同的训练样本,预测的准确性会受到影响。为了克服这个缺点,广泛的样本应该用于培训。

另一个似乎是可能的方差是扭曲或偏见影响的结果数据集所示模型由其他数据集(图4;补充数据S2-S4)。以来这是一个重要的考虑一个实际使用R400将测试样品和未知的暴露剂量的病人诊断。可以开发一种标定方法允许正确预测,落在倾斜线。模型训练结合数据集似乎对未知样品剂量的预测能力。更多的数据集可以添加到模型中,以增加其预测全面性与未知样品接触的情况。相结合的积极成果两个数据集和测试数据集三分之一意味着一个模型,可以通过添加更多更广泛地使用新样本数据集。这应该让模式更适用于更广泛的人口使其能够更好地测试未知样本不同临床场景。

有一个健壮的训练数据集从许多异构的样品应该提供更好的可预测性在广泛多样的人口。以确保最包容的模型是建立将敏感和特定基因响应跨不同人群,广泛的样本所有人口和地理位置应该用于培训。我们开始测试的有效性使用来自多个数据集的训练集建立增加样本的可预测性未知来源。这样做,必须合并数据集来模拟训练数据的持续的收集一个健壮的、现实世界的模型。

文献验证一些选定的基因

辐射治疗癌症患者时经常遇到(例如,肺或乳腺癌)。尽管大约一半的病人放疗宽容,别人经验的负面影响(Borrego-Soto et al ., 2015)。粒子的电离辐射可以转移他们的一些高能原子和释放电子,将影响DNA的共价键(即。在DNA打破,因为共同的债券)(Borrego-Soto et al ., 2015)。这可能会导致细胞凋亡甚至不受控制的扩散(Borrego-Soto et al ., 2015)。就地机制由一连串的生化事件引发的基因调控等应对辐射事件(Borrego-Soto et al ., 2015)。细胞机制来抵消这种风险,包括修复DNA单链断裂机制、双链DNA断裂,框架转变突变甚至代活性氧和活性氧化物种(Borrego-Soto et al ., 2015)。图5突显出具体辐射与p53和可能的途径是触发使用我们的五大选择基因。

图5
www.雷竞技rebatfrontiersin.org

图5。尽管有许多通路细胞压力,通常细胞压力的行为通过磷酸化的p53肿瘤抑制基因。P53称为《卫报》的基因组是参与各种修复机制。p53的磷酸化作用模式的基础上,细胞修复的各种生化途径被激活。还有其他的途径,例如,FHL2通路也处理细胞压力和二价函数,即:,也作为肿瘤抑制或促进剂。

的一个至关重要的抗癌或细胞修复机制在我们的身体是p53通路。通常,p53产生由细胞MDM2 ubiquitylated连接酶,水解26 s蛋白酶体(罗伊et al ., 2022)。然而,辐射或任何代谢应激导致p53的磷酸化不同程度的n端(他et al ., 2019年)。这些影响发生而发生乙酰化、磷酸化或sumoylation通过细胞周期蛋白依赖性激酶、检查点激酶或Homeodomain-Interacting蛋白质Kinase-2 (赵和马利克,2022年)。这些磷酸化模式防止MDM2绑定和p53的泛素化(古永锵et al ., 2022)。基于p53的磷酸化程度和模式,不同的模式下的级联生化事件发生。

据报道,γ辐射影响基于Fas死亡受体基因,属于一个家庭的死亡受体称为肿瘤坏死因子(鲁et al ., 2021)。Fas受体的激活促进细胞凋亡的细胞。还有其他途径参与外在p53通路。内在p53通路,另一方面,包括蛋白质的bcl - 2类,继电器细胞色素c的释放通过透化作用(Zhang et al ., 2021)。伯灵顿pro-apoptotic蛋白质,代谢压力期间,彪马和病因是释放,刺激从线粒体细胞色素c的释放(印度季风et al ., 2021)。凋亡Protease-Activating因子- 1、Procaspase-9和细胞色素c结合形成apoptosome复合物。caspase-9 apoptosome激活caspase3的一部分,caspase6 caspase9,促进最终灭亡的异常细胞(Avrutsky和特洛伊,2021年)。

辐射会导致类似的代谢与压力相关的事件,我们的结果表明显著相似性辐射和其他代谢瀑布癌症相关的事件。我们挑选了几位高级基因R400签名来评估我们的发现和报道文献综述作为证据。

GADD45A基因在我们的名单(排名1)表示由于压力增长条件,包括辐射,也显示在表达显著增加超过56%的病人,在阶段0食道癌(石黑浩et al ., 2016)。激活是独立的但有时与p53肿瘤抑制基因的激活。增加患者的表达GADD45A显示更高的存活率(石黑浩et al ., 2016)。此外,发现GADD45A过度使用Si-RNA导致癌细胞的转染细胞更强,导致更少的细胞变成凋亡当暴露于辐射(Zhang et al ., 2011)。

MDM2基因在我们的名单(排名2)属于一个类负责携带p53的癌基因蛋白细胞质细胞核,p53被蛋白水解酶降解(门多萨et al ., 2014,2页)。结果发现放大的扩增子从肿瘤发生的鼠标3 t3dm细胞系。它抑制了p53肿瘤抑制基因,这是引发辐射和癌症等在压力增长条件。P53负责激活各种修复机制,如反血管增生的基因,阻止细胞生长周期,细胞凋亡、DNA修复和自噬。基本上P53触发MDM2的转录激活,进而块P53除非更多P53与额外的或增量应力释放细胞(门多萨et al ., 2014)。也报道,暴露紫外线和电离辐射的细胞直接与MDM2的表达增加(佩里,2004,2页)。TNFSF4基因(排名3在我们的列表)属于肿瘤坏死因子超家族,也被称为肿瘤坏死因子(“TNFSF4肿瘤坏死因子超家族成员4(智人(人类))”,国家医学图书馆,2022年),发现异常表达在乳腺癌癌(李K et al ., 2021)。作为癌症变得越来越激进,免疫系统削弱。活化的免疫细胞被发现与TNFSF4基因的表达增加(李K et al ., 2021)。剂量依赖性增加TNFSF4被发现在x射线辐射(李et al ., 2014)。然而,它的表达也发现与化疗耐药有关的癌癌的细胞和凋亡减少行为暴露在辐射随着药物如顺铂(李Y et al ., 2021)。

FHL2(排名4列表)中被报道为胰腺癌的生存是非常重要的,它是发现,减少低表达相关生存细胞(Zienert et al ., 2015)。发现阻止癌细胞的细胞周期或细胞暴露于辐射(王et al ., 2021,p . 2)。FHL2还发现在p53基因激活的肿瘤抑制基因激活当细胞暴露于压力条件如癌症或DNA损伤由于辐射,虽然不是直接关系到p53 (徐et al ., 2014)。

POLH(排名5在我们的列表)属于一个家庭的DNA聚合酶和DNA损伤被发现调节由于暴露于电离辐射。也发现,敲打出或下调XPV基因导致细胞突变和呈现他们对紫外线敏感,也会引起问题,因为它会损害p53激活在DNA损伤也增加了肿瘤细胞的抗凋亡(刘、陈,2006年)。PHLDA3(在我们的列表排名6)是另一种激活p53的下游产品。它是许多流派p53激活其DNA修复套件的一部分。它被发现在许多肺部癌被激活,表明作为保护机制对抗癌症。PHLDA3发现禁用Akt,这有助于MDM2蛋白块p53在他们的自身调节的反馈循环(森et al ., 2009)。PHLDA3基因的失活促进胰脏癌的发展。发现PHLDA3基因的表达也与暴露于紫外线或伽马辐射(Ohki et al ., 2014)。这些发现证实我们的顶级的几个基因的表达变化可以导致细胞的变化作为特定通路的一部分辐射暴露。

结论

似乎存在一个特定的geneset提供一个最佳的预测能力诊断病人接触未知的辐射剂量。这些基因的大小和顺序当用于模型的训练是很重要的在测试样品准确和可靠的结果。R400提供最好的结果在测试中使用的三个数据集。因为其他数据集或样本可能不包含表达式从R400所有的基因,R1000创建并包含这里,最好的400个基因中可用的测试数据可以被选中。

广泛的适用性,应该融入更多的数据集模型构建,因为更多的样品可以构建一个更健壮的模型由于更广泛的人口通过使用更多的捐助者表示合并。虽然在这项研究中使用的数据集捐赠可变性,有限数据集的结合是为了测试合并不同的数据集的可行性增加基因签名的功效不同的人群。未来应该努力发现和吸收辐射的数据集,其中包含样本将增加训练数据的变化在这些特征。时间/辐射暴露持续时间影响不同的基因不同。拥有一个健壮的数据集的构建模型是很重要的,确保其适用于不同的场景。这包括时间/持续时间的因素,因为随着时间的流逝每个基因签名将继续在可预测的方式反应。这表明R400 / R1000基因签名将有一个“可预测”的反应随着时间的推移,和剂量。在这篇文章中,我们并没有消除或包含任何样品基于时间/时间,而是允许固有的异构数据集用于构建模型。每个数据集有自己的时间表,我们也感到了时间的变化/持续时间在这项研究。我们可以说基因显示反应至少24小时因为这是最短的时间内的测试中在这项研究中使用的数据集。 Since the R400/R1000 model evaluates the expressions of each gene, which each change in predictable ways, the model can learn to even predict the time/duration of samples given enough heterogeneity in the training data. This makes the R400/R1000 applicable to times ranging from earliest changes to latest changes. In this study, the model also correctly classified non-irradiated samples implying that the model can be used as soon as radiation exposure is suspected.

结果显示线性R400和剂量之间的关系。这种相关性进一步支持的结果显示在第三个的预测数据集的扭曲在另外两个模型训练数据集进行测试。

其他论文文献综述中发现通常只列出三个二十基因和一些上市到1000。本研究的相关结果看一组基因大小选择通过限制基因只有相关性分数高于0.80。这导致一组基因28第一数据集的大小。基因测试显示,超过提供更好的预测结果,在400年达到顶峰,800个基因。前400个基因中发现的所有三个数据集给最好的结果,被称为R400。第二个基因集的前1000个基因中发现的所有三个数据集被命令,叫R1000。它的主要目的是提供一个更大的选择的基因创造一套R400对于任何给定的样品可能没有列出的所有基因R400发现的。

数据可用性声明

在这项研究中提出的数据集可以在网上找到存储库。库的名称/存储库和加入数量(s)可以在文章中找到补充材料

作者的贡献

FS和操作系统概念问题。FS负责解决方案的开发和实现。SV和操作系统负责验证新的预测。FS和操作系统回顾了文本和评价的工作。操作系统负责这项研究。

资金

这项研究得到了堆椅子圣弗朗西斯泽维尔大学捐赠基金通过h·斯坦利博士和朵琳小巷堆Chairship。

的利益冲突

作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。

出版商的注意

本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。

补充材料

本文的补充材料在网上可以找到:https://www.雷竞技rebatfrontiersin.org/articles/10.3389/fsysb.2022.1022486/full补充材料

引用

Avrutsky, m . I。,and Troy, C. M. (2021). Caspase-9: a multimodal therapeutic target with diverse cellular expression in human disease.前面。杂志。12日,701301年。doi: 10.3389 / fphar.2021.701301

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Biolatti, V。•L。,Bellora, N., and Ibañez, I. L. (2021). High-throughput meta-analysis and validation of differentially expressed genes as potential biomarkers of ionizing radiation-response.Radiother。肿瘤防治杂志。154年,第21至28。doi: 10.1016 / j.radonc.2020.09.010

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Borrego-Soto G。,Ortiz-López, R., and Rojas-Martínez, A. (2015). Ionizing radiation-induced DNA injury and damage detection in patients with breast cancer.麝猫。摩尔。杂志。38岁,420 - 432。doi: 10.1590 / s1415 - 475738420150019

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Broustas, c·G。徐,Y。,Harken, A. D., Garty, G., and Amundson, S. A. (2017a). Comparison of gene expression response to neutron and x-ray irradiation using mouse blood.BMC基因组学18日,2 - 13。doi: 10.1186 / s12864 - 016 - 3436 - 1

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Broustas, c·G。徐,Y。,Harken, A. D., Chowdhury, M., Guy, G., and Amundson, S. A. (2017b). Impact of neutron exposure on global gene expression in a human peripheral blood model.Radiat。Res。187年,433 - 440。doi: 10.1667 / RR0005.1

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

印度,一个。,George, B. P., and Abrahamse, H. (2021). Interactions of multidomain pro-apoptotic and anti-apoptotic proteins in cancer cell death.Oncotarget12日,1615 - 1626。doi: 10.18632 / oncotarget.28031

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

埃瓦尔德,j . D。Soufan, O。易碎的D。,Hecker, M., Xia, J., and Basu, N. (2020). EcoToxModules: custom gene sets to organize and analyze toxicogenomics data from ecological species.环绕。科学。抛光工艺。54岁,4376 - 4387。doi: 10.1021 / acs.est.9b06607

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

埃瓦尔德,J。,Soufan, O。夏,J。,and Basu, N. (2021). FastBMD: an online tool for rapid benchmark dose–response analysis of transcriptomics data.生物信息学37岁,1035 - 1036。doi: 10.1093 /生物信息学/ btaa700

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Ghandhi, s。,Smilenov, L. B., Elliston, C. D., Chowdhury, M., and Amundson, S. A. (2015). Radiation dose-rate effects on gene expression for human biodosimetry.BMC医学基因组学。8,22-10。doi: 10.1186 / s12920 - 015 - 0097 - x

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

他,F。,Borcherds, W., Song, T., Wei, X., Das, M., Chen, L., et al. (2019). Interaction between p53 N terminus and core domain regulates specific and nonspecific DNA binding.Proc。国家的。学会科学。美国的一个。116年,8859 - 8868。doi: 10.1073 / pnas.1903077116

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

豪,O。,White, L., Cullen, D., O’Brien, G., Shields, L., Bryant, J., et al. (2021). A 4-gene signature of CDKN1, FDXR, SESN1 and PCNA radiation biomarkers for prediction of patient radiosensitivity.Int。j .摩尔。科学。22日,10607年。doi: 10.3390 / ijms221910607

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

石黑浩,H。木村,M。,Takahashi, H., Tanaka, T., Mizoguchi, K., and Takeyama, H. (2016). GADD45A expression is correlated with patient prognosis in esophageal cancer.肿瘤防治杂志。列托人。11日,277 - 282。doi: 10.3892 / ol.2015.3882

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

森,T。Ohki, R。,Shibata, T., Tsutsumi, S., Kamimura, N., Inazawa, J., et al. (2009). PH domain-only protein PHLDA3 is a p53-regulated repressor of Akt.细胞136年,535 - 550。doi: 10.1016 / j.cell.2008.12.002

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

古,N。,Sharma, A. K., and Narayan, S. (2022). Therapeutics targeting p53-MDM2 interaction to induce cancer cell death.Int。j .摩尔。科学。23日,5005年。doi: 10.3390 / ijms23095005

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

拉康姆猪,J。硅镁层,C。,Amundson, S. A., and Zenhausern, F. (2018). Candidate gene biodosimetry markers of exposure to external ionizing radiation in human blood: A systematic review.《公共科学图书馆•综合》6 13,e0198851。doi: 10.1371 / journal.pone.0198851

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

鲁,C。,Rudqvist, N.-P., Yamazaki, T., Zhang, T., Charpentier, M., Galluzzi, L., et al. (2021). Radiotherapy-exposed CD8+ and CD4+ neoantigens enhance tumor control.j .中国。投资。131年,138740年。doi: 10.1172 / JCI138740

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

李,K。,Ma, L., Sun, Y., Li, X., Ren, H., Tang, S.-C., et al. (2021). The immunotherapy candidate TNFSF4 may help the induction of a promising immunological response in breast carcinomas.科学。代表。11日,18587年。doi: 10.1038 / s41598 - 021 - 98131 - 4

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

李,s E。郭,F。,Wang, P., Han, L., Guo, Y., Wang, X. A., et al. (2014). X-ray-induced expression changes of TNFSF4 gene in human peripheral blood.生物医学。环绕。科学。27日,729 - 732。doi: 10.3967 / bes2014.107

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

李,Y。,Chen, Y., Miao, L., Wang, Y., Yu, M., Yan, X., et al. (2021). Stress-induced upregulation of TNFSF4 in cancer-associated fibroblast facilitates chemoresistance of lung adenocarcinoma through inhibiting apoptosis of tumor cells.癌症。497年,212 - 220。doi: 10.1016 / j.canlet.2020.10.032

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

刘,G。,and Chen, X. (2006). DNA polymerase η, the product of the xeroderma pigmentosum variant gene and a target of p53, modulates the DNA damage checkpoint and p53 activation.摩尔。细胞。医学杂志。26日,1398 - 1413。doi: 10.1128 / mcb.26.4.1398 - 1413.2006

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

卢卡斯,J。,Dressman, H. K., Suchindran, S., Nakamura, M., Chao, N. J., Himburg, H., et al. (2014). A translatable predictor of human radiation exposure.《公共科学图书馆•综合》9,e107897。doi: 10.1371 / journal.pone.0107897

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

门多萨,M。,Mandani, G., and Momand, J. (2014). The MDM2 gene family.Biomol。概念5,9-19。doi: 10.1515 / bmc - 2013 - 0027

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

国家医学图书馆(2022)4 (TNFSF4肿瘤坏死因子超家族成员智人(人类)。美国:美国国家医学图书馆基因身份证:7292 2022年6月23日更新。

谷歌学术搜索

Ohki, R。,Saito, K., Chen, Y., Kawase, T., Hiraoka, N., Saigawa, R., et al. (2014). PHLDA3 is a novel tumor suppressor of pancreatic neuroendocrine tumors.Proc。国家的。学会科学。美国的一个。111年,E2404-E2413。doi: 10.1073 / pnas.1319962111

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Ostheim, P。,Amundson, S. A., Badie, C., Bazyka, D., Evans, A. C., Ghandhi, S. A., et al. (2022). Gene expression for biodosimetry and effect prediction purposes: promises, pitfalls and future directions – key session ConRad 2021.Int。j . Radiat。医学杂志。98年,843 - 854。doi: 10.1080 / 09553002.2021.1987571

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Panera, N。,Camisa, V., Brugaletta, R., Vinci, M. R., Santoro, A., Coscia, E., et al. (2021). Blood cell gene expression profiles: a narrative review of biomarkers and effects of low-dose ionizing radiation exposure.j .健康Soc。科学。6、349。doi: 10.19204 / 2021 / bldc9

CrossRef全文|谷歌学术搜索

佩里,m . e . (2004)。Mdm2在辐射的响应。摩尔。癌症Res。2,9-19。1541 - 7786.9.2.1 doi: 10.1158 /

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

罗伊·p·K。,Biswas, A., Deepak, K., and Mandal, M. (2022). An insight into the ubiquitin-proteasomal axis and related therapeutic approaches towards central nervous system malignancies.Biochimica Biophysica学报(BBA)评论癌症1877年,188734年。doi: 10.1016 / j.bbcan.2022.188734

CrossRef全文|谷歌学术搜索

Shuryak,我。,Ghandhi, s。,Turner, H. C., Weber, W., Melo, D., Amundson, S. A., et al. (2020). Dose and dose-rate effects in a mouse model of internal exposure from 137Cs. Part 2: integration of gamma-H2AX and gene expression biomarkers for retrospective radiation biodosimetry.Radiat。Res。196年,491 - 500。doi: 10.1667 /条- 20 - 00042.1

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

西蒙,r (2011)。在预测医学基因组生物标志物。一个临时的分析。EMBO摩尔。地中海。3 (3),429 - 435。doi: 10.1002 / emmm.201100153

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Soufan, O。,埃瓦尔德,J。,Viau, C., Crump, D., Hecker, M., Basu, N., et al. (2019). T1000: a reduced gene set prioritized for toxicogenomic studies.PeerJ13个7,e7975。doi: 10.7717 / peerj.7975

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Soufan, O。,Kleftogiannis, D., Kalnis, P., and Bajic, V. B. (2015). DWFS: a wrapper feature selection tool based on a parallel genetic algorithm.《公共科学图书馆•综合》10,e0117988。doi: 10.1371 / journal.pone.0117988

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Spainhour, j . C。Lim, h·S。,咦,s V。,and Qiu, P. (2019). Correlation patterns between DNA methylation and gene expression in the Cancer Genome Atlas.癌症正无穷。18日,1176935119828776。doi: 10.1177 / 1176935119828776

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

萨勃拉曼尼亚,一个。Narayan, R。,Corsello, S. M., Peck, D. D., Natoli, T. E., Lu, X., et al. (2017). A next generation connectivity map: L1000 platform and the first 1, 000, 000 profiles.细胞171年12,1437 - 1452。doi: 10.1016 / j.cell.2017.10.049

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

王,G。,Niu, X., Liu, H., Dong, Q., Yao, Y., Wang, D., et al. (2021). c‐Abl kinase regulates cell proliferation and ionizing radiation‐induced G2/M arrest via phosphorylation of FHL2.2月开放的生物11日,1731 - 1738。doi: 10.1002 / 2211 - 5463.13177

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

徐,J。,Zhou, J., Li, M.-S., Ng, C.-F., Ng, Y.-K., Lai, P. B.-S., et al. (2014). Transcriptional regulation of the tumor suppressor FHL2 by p53 in human kidney and liver cells.《公共科学图书馆•综合》9,e99359。doi: 10.1371 / journal.pone.0099359

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

张X。,X。,Wang, C., Zhou, C., Liu, G., Wei, F., et al. (2011). Over-expression of Gadd45a enhances radiotherapy efficacy in human Tca8113 cell line.学报杂志。罪。32岁,253 - 258。doi: 10.1038 / aps.2010.208

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

张,Y。,Yapryntseva, M. A., Vdovin, A., Maximchik, P., Zhivotovsky, B., and Gogvadze, V. (2021). Modeling hypoxia facilitates cancer cell survival through downregulation of p53 expression.化学。医学杂志。交互。345年,109553年。doi: 10.1016 / j.cbi.2021.109553

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

赵,P。,and Malik, S. (2022). The phosphorylation to acetylation/methylation cascade in transcriptional regulation: how kinases regulate transcriptional activities of DNA/histone-modifying enzymes.细胞Biosci。83 - 23。doi: 10.1186 / s13578 - 022 - 00821 - 7

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Zienert E。勉强我。,Aust, D., and Cordes, N. (2015). LIM-only protein FHL2 critically determines survival and radioresistance of pancreatic cancer cells.癌症。364年,17-24。doi: 10.1016 / j.canlet.2015.04.019

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

关键词:基因签名,剂量预测,p53通路,电离辐射,基因表达分析,机器学习的即时(POC)的诊断

引用:圣彼得F, Vadrev SM和Soufan O (2022) R400:一种新型基因签名在辐射剂量的预测研究人类。前面。系统。医学杂志。2:1022486。doi: 10.3389 / fsysb.2022.1022486

收到:2022年8月18日;接受:2022年10月12日;
发表:2022年10月26日。

编辑:

Tarunendu Mapder美国百时美施贵宝公司,

审核:

Sohini Chakraborty,格罗斯曼医学院、美国纽约大学
Sukanya萨哈国家环境健康科学研究所(NIH),美国

版权©2022圣彼得,Vadrev Soufan。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

*通信:奥斯曼Soufan,osoufan@stfx.ca

下载