自动分类的信号区域1H核磁共振光谱
- 1Dipartimento愿望Molecolari e Nanosistemi, Ca Foscari意大利di威尼斯,威尼斯,意大利
- 2消息Hochschule毛皮Angewandte Wissenschaften (ZHAW),瑞士苏黎世
- 3计算科学研究所、大学苏黎世(不会),瑞士苏黎世
- 4Fallanden力量瑞士AG),瑞士
信号的识别和表征地区核磁共振(NMR)谱分析中是一个具有挑战性但至关重要的阶段和决心的复杂化合物。在这里,我们提出一个新颖的监督深度学习的方法进行自动检测和分类的多胎1H NMR谱。我们的深层神经网络训练的大量合成光谱,与完全控制在样品的特性。我们表明,我们的模型可以有效地检测信号区域和最小化分类误差之间的不同类型的共振模式。我们证明了网络推广非常真实的实验1H NMR谱。
1。介绍
自发现以来,核磁共振(NMR)谱已成为一个有效的和可靠的工具为研究复杂的分子化合物,使用核自旋的相互作用,原子的固有属性,磁场。一个核磁共振光谱包含不同类型的共振频率的函数,包括孤立的山峰,被称为单线态、双峰值,称为对比,复合组的多个峰值,通常被称为多胎(基勒,2002)。多重态的频率坐标(化学位移),加上多重谱线轮廓的集成,共振模式和连续峰之间的距离在同一多重态(耦合常数),作为一个分子指纹。这些特性提供了了解原子的丰度,当地的化学环境内的分子及其连通性和立体化学。
核磁共振光谱被广泛应用的传统领域是有机化学,它用于新的天然化合物和反应产物的结构说明(Jackmann Sternhell, 1969)。然而,核磁共振光谱学在许多科学领域普遍存在,结合定性和定量方法。信息提取的化学变化,耦合常数和峰值集成用于研究代谢途径的动力学和分隔系统生物化学(风扇和车道,2016年),为肿瘤的诊断、血肿和其他疾病(如多发性硬化症)在医学(齐亚et al ., 2019),描述的腐殖质物质和污染物的分析在环境科学(Cardoza警官et al ., 2004评估),土壤成分,植物组织和复杂的农业食品化合物(Mazzei短笛,2017)和食品化学(曹et al ., 2021)。
然而,有一个主要缺点。从光谱检索信息的过程往往是非常苛刻的,耗时且容易出错。它需要专家的参与光谱学家执行人工注释的光谱,化学位移和耦合常数提取,结构说明。此外,核磁共振光谱的评价和解释并不总是直截了当的和明确的,但由于存在光谱工件和重叠的共鸣。因此,引入自动化的NMR分析可能会加速和促进过程,同时增加结果的鲁棒性和再现性。
其中一个任务,可以大大受益于信号的引入自动化是注释区域的耦合常数模式。早期的自动方法是基于局部对称属性(Boentges et al ., 1989),最大熵技术(Delsuc和税,1988年;Seddon et al ., 1996;Stoven et al ., 1997),多胎反褶积(Jeannerat Bodenhausen, 1999)和模式识别(Golotvin Chertkov, 1997)。Hoye提出了一种递归算法(Hoye et al ., 1994;Hoye赵,2002)来推断出多重谱线的分裂树已先后与对称和振幅补充约束(Golotvin et al ., 2002;Cobas et al ., 2005)。这些方法的局限性,他们是应用于一个共振在预期的时间和需要之前的信息数量的峰值。格里菲思(2000)介绍一种自动程序将各个山峰聚合成多胎在整个频谱。尽管如此,该模型依赖于知识的确切位置的峰值,这阻碍了完成任务的自动化。即使古典方法仍采用(Jeannerat Cobas, 2021),注意最近转向深度学习以其独特的力量达到人类性能及以上图像分类、语音识别和自然语言处理(勒存et al ., 2015;Baraniuk et al ., 2020)。深度学习的潜力已经被用来执行不同阶段的NMR分析(陈et al ., 2020;Cobas 2020),从重建和去噪信号的光谱的解释,包括化学位移预测(乔纳斯et al ., 2022),自动挑选峰值和光谱反褶积(Paruzzo et al ., 2019;李et al ., 2021;施密德et al ., 2022),完全自动化的结构验证(Klukowski et al ., 2022)。
然而,我们所知,基于深度学习算法,能够识别的共振模式多胎在整个一维谱而无需人工干预,没有任何先验信息的结构分子,仍下落不明。
这里我们引入一个监督深度学习模型,执行自动检测和分类的一维核磁共振光谱信号的地区。网络的体系结构包括一维卷积的结合层,长期短期记忆层和完全连接层,这已经被证明是有效的序列和信号分析(Sainath et al ., 2015;Mutegeki汉,2020年;徐et al ., 2020;Tasdelen森,2021年;Ozkok侯赛因,2022)。类似于人工注释过程,输出是一个标签的逐点详述的预测价值,对应于给定的共振模式。网络训练和定量测试实验10日合成光谱和光谱的小分子,产生一个高度精确的和健壮的重叠共振的特性的方法1H NMR谱。
2。方法
我们实现了一个监督深入学习算法来检测和定位信号的地区1H NMR谱和分类对他们的共振模式为七个多重态类:汗衫,紧身衣,三胞胎,四重奏,五重奏,的六重奏的七重奏时。1H NMR光谱一般的存在共振部分或完全覆盖其他共振。这些所谓的重叠的多胎被排除在分析。预测是基于共振的形状,在没有任何先验信息分子引起频谱及其结构。
2.1。训练集
模型的训练与100000年合成一维核磁共振光谱段。从头开始生成输入数据有各种优势。众所周知,深入学习算法需要大量的样本训练,和人工生产确保了几乎无限的样本。光谱的标签可进行自动创建光谱时。这克服了困难找到一个广泛的数据集由NMR专家注释不花钱的,快速、健壮的过程。此外,生成样本代表保证完全控制功能,从而能够调整训练集对任务的要求。
光谱的片段都是模拟以1024分的范围0.512 ppm,基地400 MHz的频率。信号区域的数量包括在一个谱段指数衰减。共振模式之间包含在每个谱随机采样七多重态类:汗衫,紧身衣,三胞胎,四重奏,五重奏,的六重奏的七重奏时。在核磁共振理论中,山顶有一个洛伦兹概要文件(基勒,2002)。然而,由于不完善的实验条件下,峰概要结果与高斯卷积的洛伦兹lineshape lineshape,沃伊特概要文件,可以用下面的复制Pseudo-Voigt近似(Kielkopf 1973):
在ω0是最大的位置,G是高斯lineshape及其方差σ是,l洛伦兹lineshape和γ半极大处是它的一半宽度(HWHM)。高斯和洛伦兹lineshapes HWHM相同的生成,所以。0.5和7之间的参数γ采样赫兹,而参数l年代0之间的采样,对应于洛伦兹限制,1,对应于高斯极限。多胎的振幅采样复制高动态范围通常被发现在实验光谱。连续峰之间的距离的比值在多重态,对共振模式对应于耦合常数J和半宽度(应用)的山峰2γ,不一0.5到18实现不同级别的信号分辨率。在这种情况下一个拥有更高分辨率的多重态峰分离。使合成光谱尽可能接近他们的实验,介绍了不同种类的效果和扭曲。给定的高斯噪声添加到样品,有一个10之间的信号噪声比1/2和105/2。此外,小阶段和基线扭曲了(见补充材料),为了使算法的预测更健壮的实验输入光谱显示剩余阶段和基线校正后扭曲。最后,模拟屋顶的效果(基勒,2002)由于强耦合的相互作用,我们稍微改变了理论上预期峰值振幅比率。
一旦生成多胎,光谱是标记,分配到每个点的价值它属于的类。多重态标签集的一个子集自然数。数字从1到7人用于汗衫七重奏时类,而基线点标有数字0。
2.2。网络体系结构
的网络实现多胎的检测和分类的特征是一个架构类似于使用的一个施密德et al。(2022)光谱反褶积的任务。NMR谱第一次被发送到一个Inception-like模块(Szegedy et al ., 2015)由四个1维卷积16层过滤器与内核大小4、16,64年和256年(见图1)。每一层是紧随其后的是一个指数线性单元(ELU)激活函数。被一个信号覆盖区域范围随线宽度和峰值的数量包括在该地区(例如,一个单线态扩展通常小于七重奏)。包括一个Inception-like模块保证的可能性达到更高层次的复杂性,提取特征在不同长度尺度,同时降低计算费用和减轻过度拟合训练集。之后当分布式完全连接层,一方面通过双向长期短期记忆(LSTM)层。双向性意味着信息流动在两个方向上的重复模块层。这个组件是决定性的在我们的例子中,确保每个谱点的预测是由功能出现在它的双方,多胎沿频率轴的定位没有影响的分类。
图1。从自动预测分析。(一)图网络的体系结构。CONV1D是一维卷积层,BIDIR LSTM是一个双向LSTM层,致密是当分布式完全连接层和SOFTMAX将SOFTMAX输出。在这里,每一层的类型与内核大小,在卷积层,和单位的数量,在完全连接的情况下和LSTM层(见也补充材料)。网络产生的预测一个标签的高度代表了多重态类。(B)信号的分类。真正的阳性(TP),假阳性(FP),真正的底片(TN)和假阴性(FN)定义为给定的多重态类基于混淆矩阵的条目。(C)信号检测:十字路口在联盟(借据)定义一个一维框架。
连续层四当分布式致密层的节点数量减少,从512年到类的数量,其次是解决线性单元(ReLU)激活函数。最后,softmax输出为每个点的光谱属于每个多重态类的概率。
在培训过程中,网络的架构获得一系列合成输入样本x与相应的标签y。所有的1、225、606可训练的权重θ是更新在每个学习时代为了最小化分类熵损失函数。网络训练为33时代惠普Z2塔G5工作站与英特尔(R) (TM)核心i7 - 10700 CPU和CometLake-S GT2 [UHD图形630]GPU。跟踪培训过程中,我们这组分割成两个子组。第一组是由75、000段用来训练,第二组是由000段用来验证。训练阶段,年底的网络已经学了一个复杂函数输入Φθ(x),考虑最可能的多重态类的所有类l,能够输出标签预测向量。当运行该模型在整个实验光谱,网络的输入是调整以匹配谱点的数量。提高预测,实验光谱重新取样,以获得相同数量的分赫兹训练集。
2.3。评价指标的分类
自网络产生一个预测逐点详述的,最直接的对网络的性能进行评估的方法,以检查是否每个点的光谱是正确分类在不同的多重态类。我们称这种方法为逐点地方法。然而,相当担心的评估预测,不仅在个人点,但在多重态作为一个整体。我们指的是第二种方法object-wise方法。
2.3.1。逐点地方法
我们计算了混淆矩阵多分类问题的区分各种类型的多胎(帕迪拉et al ., 2020)。混淆矩阵是一个平方交叉表C列表示预测的类和行代表实际的类。每个元素的矩阵Cij包含点属于类的数量我类内,预测的网络j。混淆矩阵的四个性能指标可以被定义,真正的阳性(TP),假阳性(FP),假阴性(FN)和真正的底片(TN),是显示在图1。这些指标有助于解释错误网络产生的具体性质,指出混淆的来源分类算法。对于每一个多重态类,我们测量(Hossin Sulaiman, 2015)精度(一)正确分类分光谱的一部分,精度(P)的正确预测在给定类的所有预测这类,回忆(R)的正确预测率在所有地面真理在一个给定的类,和F1的分数调和平均数的精度和召回。一种有效的分类器应该最大化精度和召回,这是同时减少假阳性和假阴性。因此,F1的分数是一个可靠的网络指标的性能,因为它代表一个中点之间的精度和召回。
2.3.2。Object-wise方法
评估整个信号区域分类模型,我们计算了precision-recall曲线调整的方法帕迪拉et al。(2020)维的情况。我们定义了一个标签预测 点的连接设置有一个给定的标签l,包围,通过基线点或点,其他标签。我们定义了信心每个标签预测的平均将softmax分属于该标签的输出预测:
所有预测标签,除了基线标签,排名与他们的信心在减少。对于每一个预测,十字路口在联盟(借据)指标计算。就像名字说的那样,借据的比值之间的交叉区域的面积预测的标签和地面实况标签,在这些领域的结合。在一维情况下,地面真值向量y和预测向量,借据就变成:
向下的排名列表标签预测,每个预测被认为是一个真正的积极如果借据上面一个阈值t通常设置为0.50或0.75。否则,它被认为是假阳性。对列表中的每个预测,计算精度的函数增加召回,获得precision-recall曲线。精密测量到目前为止遇到的真阳性之间的比率在列表中所有遇到的预测到目前为止,虽然回忆测量之间的比例列表中迄今为止遇到的真阳性总数的预测。
曲线下的面积(AUC) precision-recall曲线,通常称为平均精度(美联社),测量与一个插值过程点n的曲线:
与
在哪里P和R分别表示精度和召回的值。
获得一个好的结果的object-wise统计不仅确保大部分的谱点被正确分类,已经可以证明通过逐点地统计数据,但它也确保了预测不是支离破碎。一个支离破碎的预测发生在不同的光谱分属于同一信号的地区在不同的多重态类进行分类。这是一个常见的问题逐点算法产生一个输出。当在一个信号区域有多个分类预测,每个连接集被认为是一个单独的标签预测与适度的真理与地面相交区域,导致性能下降。
3所示。结果
3.1。合成光谱
我们合成光谱的分类模型超过10000段生成独立于训练集分类的一个例子。在综合生产段中显示图2。的性能预测每个多重态类报道混淆矩阵图3。矩阵的条目是沿着行归一化,即在地面实况点每个类的总数。矩阵的对角线上的真阳性率都在99%以上。即使很低,最常见的错误包括基线类:基线点作为信号预测点或点作为基线预测点的信号。目视检查后,很明显,这些错误发生在一个信号的边界区域和一个稍微不同的定位,可以解释的几个点,预测的标签对地面真理。然而,这些定位不准确的预测标签相比可以忽略不计的严重误解为信号噪声区域。考虑多重态类的错误率,似乎随着山峰在多重态类数量的增加了出错率降低,最高的错误率,订单的1.5%,属于单线态类。这种行为可以被考虑的存在轻微类不平衡。在逐点详述的分类算法,这个问题存在,尽管采用合成训练集。产生训练集时,共振是随机选择的,这样的模式会有平均每个多重态类的相同数量的共鸣。然而,扩展多胎的数量随峰这共鸣与更多的山峰谱点分布在一个更大的数量。因此,在培训期间,网络提供更多的点属于多胎与更高的山峰。这种行为应该被认为是用心。然而,优秀的成果甚至在单线态的情况下保证经济正常运转的分类算法。
图3。评估性能。(一)逐点的方法:在合成光谱混淆矩阵的性能。(B)Object-wise方法:Precision-recall曲线对每个多重态类(基线类除外)阈值为75%。(C)逐点的方法:混淆矩阵的性能在101H NMR光谱的测试集。
混淆矩阵,我们测量精度,精度、回忆和F1的分数。平均每个多重态类的结果一起报告的所有类表1。回忆总是在99%以上,精密,准确性和F1得分不低于98.5%。精度和召回值不跨多重态类分歧显著,平均0.21%的差异。因此,该模型能够成功地同时减少假阳性和假阴性。这可以通过分析证实precision-recall曲线(见图3)。最优分类算法会产生精度1.0召回的所有值。我们的模型是接近这个极限。借据阈值的选择,一个标签预测被确认为真阳性或假阳性是任意的,的确,每个值借据阈值定义了不同的美联社度量。在目前的工作中,我们为每个类美联社报道指标和平均超过所有类(mAP)两个阈值,50%和75%(见表1)。增加了借据阈值的概率增加一个标签预测是假阳性,恶化的整体性能指标。平均而言,从一个阈值的50%到75%的门槛降低了美联社指标仅为0.47%。还在比赛中object-wise方法,结果表明,多重态类的分类效率下降速度增加借据阈值时是单线态。
3.2。实验光谱
当训练深层神经网络的综合数据,一个健壮的泛化对真实数据,这是实验1H NMR谱,成为一个至关重要的和非平凡的目标来满足。监督学习模型通常假设输入样本训练集的样本来自相同的概率分布,将送入网络测试期间:P火车(y|x)=P测试(y|x),x是输入样本向量,然后呢y是标签向量。然而,当应用在实验光谱分类算法,他们的分布可能偏离,甚至值得注意的是,从合成光谱的训练集:P火车(y|x)≠P测试(y|x)。当没有变化的假说之间的训练和测试样本分布失败了,我们正在处理分布变化(Quinonero-Candela et al ., 2009),这可能导致恶化的预测的准确性。最近的深度学习应用程序对光谱去噪(李和金,2019年),光谱重建Non-Uniformely采样(新加坡国立大学)数据集(2019年汉森;瞿et al ., 2020),挑选和光谱峰值反褶积(李et al ., 2021;施密德et al ., 2022)已经证明它是可行的获得杰出的核磁共振实验数据与网络训练结果合成数据。
评估我们的分类模型的泛化性能,我们运行测试集组成的实验110 H NMR光谱小分子,与低分子量有机化合物(≤000道尔顿)。每个实验光谱包含32,768年或65年,(见536点补充表S3)。显示标签的预测,我们每个多重态类相关联的颜色和阴影颜色对应的信号区域预测类(见图2)。
实验测试集是由核磁共振带注释的专家,谁标记每个峰的特点:位置在ppm,振幅,线宽,线形状,它属于多重态类。
评估的分类性能实验建立定量模型,我们建立了一个混淆矩阵(见图3),考虑每个注释的高峰和检查其位置落入光谱区域标明正确的多重态类的标签。所有的紧身衣,六重奏和七重奏时出现在测试集正确分类和其他类的真阳性利率总是在80%以上。
4所示。讨论
在本文中,我们提出了一个监督深入学习网络能够模拟专家的工作光谱学家那些注释一维核磁共振光谱产生的小分子结构检索信息。一维核磁共振光谱最简单的核磁共振实验中测量设计。先进的多维技术相比,收购时间从几小时到几天,一维光谱可以收集到几分钟,导致实验成本大幅降低。所有这些原因使一维实验可取为化合物的快速评价方法。不幸的是,一维光谱也最有益的措施。例如,交叉峰的分析的二维核磁共振光谱,其中每个频率点有两个坐标,容易导致识别的双旋转夫妇,显著促进结构说明过程(Klukowski et al ., 2022)。在1H NMR谱,另一方面,相同的信息只能通过评估同时化学位移和共振模式。考虑这些限制,所有经典一维核磁共振分析的自动化方法通常是进行个人多胎(Golotvin et al ., 2002;Cobas et al ., 2005;Jeannerat Cobas, 2021),这意味着以前知识的精确位置信号的地区,和需要额外的信息或峰值的位置(数量格里菲思2000)。我们的算法探测和分类多胎同时在整个频谱。这导致显著改善网络产生以来多重态预测考虑的一个更大的部分谱比单一信号区域和提取信息也来自邻近的共鸣。
从本质上讲,网络执行目视检查,提取特征在不同长度尺度通过卷积内核层不同大小的应用。然后,LSTM层沿频率轴的相关性和学习完全连接层提取的特征映射到一个更可分空间,帮助分类。问题的定位和识别共振模式相比,核磁共振光谱可能是图像识别和目标检测任务。可以想象,同样的函数可以利用一维适应流行的对象检测网络的架构(他et al ., 2016年;Redmon et al ., 2016;任et al ., 2017)。然而,卷积的有效组合,LSTM和完全连接层已经被证明是特别适合分析和分类一维数据,如序列和信号通过不同的测量,收集提取特征,然后在数据点相关(Sainath et al ., 2015;Mutegeki汉,2020年;徐et al ., 2020;Tasdelen森,2021年;Ozkok侯赛因,2022)。此外,这种架构允许保持层数的减少相比,对象检测架构,实现健壮的结果在一个较低的计算成本。
预测多重态类逐点沿着光谱时,可能遇到的一个常见的问题是一个支离破碎的分类对信号的地区,尤其是当面临不确定的情况下。这很容易克服运用大多数滤波器作为后处理步骤。
训练集的生成是一个重要的方面,我们的模型的实现。合成生产样品的光谱几乎无限可用性保证高水平的多样性,配上一个自动,不花钱的和健壮的标记过程。结果部分中指出,当使用逐点地诱导类不平衡不能被完全根除即使合成量身定做训练集,因为多重态类高光谱的峰值分布在一个更大的集合点。考虑到所有多重态类优秀成果,存在轻微的类不平衡不妨碍整体分类性能。尽管如此,不同类别的不同数量的点应该仔细考虑在实现时,添加过多的弱势阶层或修剪模式模式的。
除此之外,多胎生成综合应密切镜子的形状和共振模式中遇到真正的实验光谱,以减轻对泛化性能分布变化的影响。在这方面,复杂共振模式不代表不能正确识别和分类训练集在现阶段。未来的研究应该包括多重态类几种耦合分裂的特征。遇到这样的共鸣1H NMR光谱越来越频繁的测量分辨率达到增加新的台式光谱仪。
即使有更高的分辨率,一维光谱通常伴随着一个广泛存在的共振躺在其他共振:所谓的重叠的多胎。因此,限制使用的动机一维核磁共振光谱分析小分子。大分子(如蛋白质,包括更多的原子,将产生过度复杂重叠的共振可能导致绝对的不确定的结果分析。
试图分类重叠峰神经网络是一个具有挑战性的任务:几个共振的信号可以添加无数的时尚,很难定义特定的特性对于这样一个类。一种可能性可以与每一个共振建立重叠的类不能适应其他多重态类。我们计划去调查这一即将到来的工作。
5。结论
总之,提出深度学习框架已经证明能够有效地检测和信号的地区进行分类1H NMR谱。网络产生了杰出的结果应用于合成光谱时,平均达到99.9%,精度指标为99.3%,精度、回忆和F1的分数。此外,学习算法已被证明是能够概括非常真实的实验1H NMR谱。为科学家们提供一个高效、可靠的工具来区分在一维共振光谱的各种类,不需要转向更复杂的和昂贵的技术,拥有的承诺加快生产流程和分析的化合物而引入更高层次的实验结果之间的一致性。
数据可用性声明
最初的贡献提出了研究中都包含在这篇文章/补充材料,进一步的调查可以针对相应的作者。
作者的贡献
GF开发代码,进行了模拟,并产生结果。NS贡献的发展方法。某人导致数据集的生成、发展的方法,结果和讨论。啊和DW的审查和讨论的结果。作为和GC导致的讨论结果。所有作者的手稿修改和阅读和批准提交的版本。
资金
这项工作由ZHAW根据Ca的第37博士周期的Foscari威尼斯大学。
确认
我们感谢Drs。Bjoern Heitmann和费德里科•Paruzzo力量瑞士AG)准备和注释的实验测试集我们的模型评估。
的利益冲突
某人是受雇于力量瑞士AG)。
其余作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。
出版商的注意
本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。
补充材料
本文的补充材料在网上可以找到:https://www.雷竞技rebatfrontiersin.org/articles/10.3389/frai.2022.1116416/full补充材料
引用
Baraniuk, R。Donoho D。,和G一个vish, M. (2020). The science of deep learning.Proc。国家的。学会科学。美国。117年,30029 - 30032。doi: 10.1073 / pnas.2020596117
Boentges, S。迈耶,B。,Griesinger, C., and Ernst, R. (1989). Local symmetry in 2D and 3D NMR spectra.j .增效。的原因。85年,337 - 358。0022 - 2364 . doi: 10.1016 / (89) 90148 - 0
曹,R。,l我u, X., Liu, Y., Zhai, X., Cao, T., Wang, A., et al. (2021). Applications of nuclear magnetic resonance spectroscopy to the evaluation of complex food constituents.食品化学。342年,1 - 10。doi: 10.1016 / j.foodchem.2020.128258
Cardoza警官,L。,科利尔。奥托,W。,Wurrey, C., and Larive, C. (2004). Applications of NMR spectroscopy in environmental science.掠夺。诊断。粉剂。的原因。Spectrosc。45岁,209 - 238。doi: 10.1016 / j.pnmrs.2004.06.002
陈,D。,Wang, Z., Guo, D., Orekhov, V., and Qu, X. (2020). Review and prospect: deep learning in nuclear magnetic resonance spectroscopy.化学。欧元。J。26日,10391 - 10401。doi: 10.1002 / chem.202000246
Cobas, J。,Con年代t一个nt我no- - - - - -C一个年代t我llo,V., Martìn-Pastor, M., and del Rìo-Portilla, F. (2005). A two-stage approach to automatic determination of 1H NMR coupling constants.粉剂。的原因。化学。43岁,843 - 848。doi: 10.1002 / mrc.1623
Delsuc, M。,和levy, G. (1988). The application of maximum entropy processing to the deconvolution of coupling patterns in NMR.j .增效。的原因。76年,306 - 315。0022 - 2364 . doi: 10.1016 / (88) 90112 - 6
粉丝,T。,和l一个ne, A. (2016). Applications of NMR spectroscopy to systems biochemistry.掠夺。诊断。粉剂。的原因。Spectrosc。92 - 93年,18-53。doi: 10.1016 / j.pnmrs.2016.01.005
Golotvin, S。,和Chertkov, V. (1997). Pattern recognition of the multiplet structure of NMR spectra.俄罗斯化学。牛。46岁,423 - 430。doi: 10.1007 / BF02495389
Golotvin, S。,Vodopianov, E., and Williams, A. (2002). A new approach to automated first-order multiplet analysis.粉剂。的原因。化学。40岁,331 - 336。doi: 10.1002 / mrc.1014
格里菲斯,l (2000)。对1 h NMR谱的自动分析。粉剂。的原因。化学。38岁,444 - 451。doi: 10.1002 / 1097 - 458 x (200006) 38:6andlt; 444:: AID-MRC673andgt; 3.0.CO; 2 z
汉森,d . (2019)。利用深层神经网络重建非均匀采样NMR光谱。j . Biomol。核磁共振。73年,577 - 585。doi: 10.1007 / s10858 - 019 - 00265 - 1
他,K。,Zhang, X., Ren, S., and Sun, J. (2016). “Deep residual learning for image recognition,” in2016年IEEE计算机视觉与模式识别会议(CVPR)(拉斯维加斯,NV: IEEE), 770 - 778。
Hossin, M。,和年代ulaiman, M. (2015). A review on evaluation metrics for data classification evaluations.Int。j .数据分钟。知识。等内容。过程5,1 - 11。doi: 10.5121 / ijdkp.2015.5201
Hoye, T。,Hanson, P., and Vyvyan, J. (1994). A practical guide to first-order multiplet analysis in 1H NMR spectroscopy.j . Org。化学。59岁,4096 - 4103。doi: 10.1021 / jo00094a018
Hoye, T。,和Zhao, H. (2002). A method for easily determining coupling constant values: an addendum to “a practical guide to first-order multiplet analysis in 1H NMR spectroscopy”.j . Org。化学。67年,4014 - 4016。doi: 10.1021 / jo001139v
Jeannerat D。,和Bodenhausen, G. (1999). Determination of coupling constants by deconvolution of multiplets in NMR.j .增效。的原因。141年,133 - 140。doi: 10.1006 / jmre.1999.1845
Jeannerat D。,和Cobas, C. (2021). Application of multiplet structure deconvolution to extract scalar coupling constants from 1D nuclear magnetic resonance spectra.粉剂。的原因。2,545 - 555。doi: 10.5194 / - 2 - 545 - 2021先生
乔纳斯,E。,Kuhn, S., and Schlörer, N. (2022). Prediction of chemical shift in NMR: a review.粉剂。的原因。化学。1021 - 1031。doi: 10.1002 / mrc.5234
Klukowski, P。里克•R。,和Güntert, P. (2022). Rapid protein assignments and structures from raw NMR spectra with the deep learning technique ARTINA.Nat。Commun。13日,2041 - 1723。doi: 10.1038 / s41467 - 022 - 33879 - 5
LeCun (Y。,Bengio, Y., and Hinton, G. (2015). Deep learning.自然521年,436 - 444。doi: 10.1038 / nature14539
李,H。,和Kim, H. (2019). Intact metabolite spectrum mining by deep learning in proton magnetic resonance spectroscopy of the brain.粉剂。的原因。地中海。82年,33-48。doi: 10.1002 / mrm.27727
李,D。,Hansen, A., Yuan, C., Brüschweiler-Li, L., and Brüschweiler, R. (2021). DEEP picker is a deep neural network for accurate deconvolution of complex two-dimensional NMR spectra.Nat。Commun。12日,5229 - 5242。doi: 10.1038 / s41467 - 021 - 25496 - 5
Mazzei, P。,和P我ccolo, A. (2017). HRMAS NMR spectroscopy applications in agriculture.化学。医学杂志。抛光工艺。阿格利司。4,2196 - 5641。doi: 10.1186 / s40538 - 017 - 0093 - 9
Mutegeki, R。,和Han, D. (2020). “A CNN-LSTM approach to human activity recognition,” in2020年国际会议上人工智能信息和通信(ICAIIC)(福冈:IEEE), 362 - 366。
Ozkok F。,和Celik, M. (2022). A hybrid CNN-LSTM model for high resolution melting curve classification.生物医学。信号的过程。控制。71年,103168年。doi: 10.1016 / j.bspc.2021.103168
帕迪拉,R。、清爽的年代。,和da Silva, E. (2020). “A survey on performance metrics for object-detection algorithms,” in国际会议系统、信号和图像处理(IWSSIP)(尼泰罗伊:IEEE), 237 - 242。
Paruzzo F。,Bruderer, S., Janjar, Y., Heitmann, B., and Bolliger, C. (2019). “Automatic signal region detection in1在H NMR光谱使用深度学习。力量白皮书。1 - 5页。
曲,X。,Huang, Y., Lu, H., Qui, T., Guo, D., Agback, T., et al. (2020). Accelerated nuclear magnetic resonance spectroscopy with deep learning.《应用化学》上。Int。版。59岁,10297 - 10300。doi: 10.1002 / anie.201908162
Quinonero-Candela, J。Sugiyama, M。,年代chwaighofer, A., and Lawrence, N. D. (2009).数据集机器学习的转变。剑桥,麻州:麻省理工学院出版社。
Redmon, J。,Divvala, S., Girshick, R., and Farhadi, A. (2016). “You only look once: Unified, real-time object detection,” in2016年IEEE计算机视觉与模式识别会议(CVPR)(拉斯维加斯,NV: IEEE), 779 - 788。
任,S。,他,K。,G我rshick, R., and Sun, J. (2017). Faster R-CNN: towards real-time object detection with region proposal networks.IEEE反式。模式肛门。马赫。智能。39岁,1137 - 1149。doi: 10.1109 / TPAMI.2016.2577031
Sainath, T。,V我ny一个l年代,O., Senoir, A., and Sak, H. (2015). “Convolutional, long short-term memory, fully connected deep neural networks,” in2015年IEEE国际会议音响、演讲和信号处理(ICASSP)(南布里斯班昆士兰:IEEE), 4580 - 4584。
施密德,N。,Bruderer, S., Paruzzo, F., Fischetti, G., Toscano, G., Graf, D., et al. (2022). Deconvolution of 1D NMR spectra: a deep learning-based approach.j .增效。的原因。347年,107357年。doi: 10.1016 / j.jmr.2022.107357
Seddon, M。,Ferrige, A., Sanderson, P., and Lindon, J. (1996). Automatic recognition of multiplet patterns and measurement of coupling constants in NMR and EPR spectra through the application of maximum-entropy deconvolution.j .增效。的原因。119年,191 - 196。doi: 10.1006 / jmra.1996.0072
Stoven, V。,Annereau, J., Delsuc, M., and Lallemand, J. (1997). A new n-channel maximum entropy method in NMR for automatic reconstruction of “decoupled spectra” and J-coupling determination.j .化学。正无穷。第一版。Sci。37岁,265 - 272。doi: 10.1021 / ci960321n
Szegedy C。刘,W。贾,Y。,年代ermanet, P., Reed, S., Anguelov, D., et al. (2015). “Going deeper with convolutions,” in计算机视觉与模式识别会议(CVPR)(波士顿,MA: IEEE), 1 - 9。
Tasdelen,。,和年代en, B. (2021). A hybrid CNN-LSTM model for pre-miRNA classification.科学。代表。11日,14125年。doi: 10.1038 / s41598 - 021 - 93656 - 0
徐,G。,Ren, T., Chen, Y., and Che, W. (2020). A one-dimensional CNN-LSTM model for epileptic seizure recognition using EEG signal analysis.前面。>。14日,578126年。doi: 10.3389 / fnins.2020.578126
关键词:核磁共振、自动信号分类,深入学习,1H光谱,多重任务
引用:Fischetti G,施密德N, Bruderer年代,Caldarelli G, Scarso, Henrici和威廉D(2023)信号区域的自动分类1H核磁共振光谱。前面。Artif。智能。5:1116416。doi: 10.3389 / frai.2022.1116416
收到:2022年12月06;接受:2022年12月22日;
发表:2023年1月11日。
编辑:
瑞奇·j·塞提菲奇堡州立大学,美国版权体能训练时©2023 Fischetti这样施密德,Bruderer Caldarelli Scarso Henrici和威廉。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。
*通信:体能训练时会Fischetti这样giulia.fischetti@unive.it