两分的功能磁共振成像数据质量控制的可靠性评估:一种标准化的协议并使用pyfMRIqc实用指南
- 1大学神经科学和神经动力学中心综合阅读、阅读,联合王国
- 2大学心理学和临床语言科学学院读书,阅读,联合王国
- 3卡迪夫大学脑成像研究中心(CUBRIC),学校心理学、生物医学和生命科学学院,卡迪夫大学、卡迪夫、英国
质量控制是一个关键的步骤,功能性磁共振成像数据的处理和分析。其目的是删除有问题的数据,否则可能导致下游错误分析和报告的结果。手动检查数据可以是一个费力且容易出错的过程,容易受到人为的错误。自动化工具的发展旨在缓解这些问题。pyfMRIqc就是这样一个工具,我们之前开发用户友好的数据质量进行评估的方法。然而,这些方法仍然生成输出,需要主观解释给定数据集的质量是否符合可接受标准进行进一步分析。这里我们提出一个质量控制协议使用pyfMRIqc和评估两分的四个独立的评级机构使用该协议的可靠性功能磁共振成像的数据开放质量控制项目(https://osf.io/qaesm/)。数据被评级机构分类为“包括”,“不确定”或“排除。评级机构之间“有中度到实质性的协议为“包括”和“排除,“但没有协议”确定。“在大多数情况下只有一个评定等级的使用“不确定”分类对于一个给定的参与者的数据,剩下的评级机构展示协议”包括“/“排除”决定在所有但一个案例。我们建议几种方法提高评定等级为“不确定”协议,减少分歧情况下,协助分类一致性。
介绍
功能性磁共振成像(fMRI)本质上是与许多潜在的多维数据源的数据可能会导致出现假的文物的结果(et al ., 2012年;凡戴克et al ., 2012)。因此,确保数据质量足够的分析是一个重要的一步处理的功能磁共振成像数据。这是特别重要的大型多站点等研究青少年大脑认知发展研究(凯西et al ., 2018)和人类连接体计划(范·埃森et al ., 2013),执行详细的所需时间,手工筛选的个人数据很快就变得棘手。为了解决这个问题,现在很多质量控制工具和管道的存在是为了帮助用户对质量做出明智的决定在他们的数据集(马库斯et al ., 2013;埃斯特万et al ., 2017;Alfaro-Almagro et al ., 2018)。这些工具自动化的一部分,质量控制process-aim减少花费的时间来评估数据质量,减少所需的先验知识做出明智的决定,在评估和减少错误。
一些工具目前存在评估功能磁共振成像数据的质量,包括MRIQC (埃斯特万et al ., 2017)和视觉质量控制(Raamana 2018)。这个列表还包括pyfMRIqc,我们开发了综合中心的神经科学和神经动力学(CINN),雷丁大学(威廉姆斯和林德纳,2020年)。我们的许多神经影像设备用户在CINN博士生和早期职业人员,加入社区,获得了实用的培训和学习机会。作为这一承诺的一部分,我们开发软件界面友好,使个人成为自信和通知研究者。pyfMRIqc帮助用户作出明智决策的质量数据通过生成各种图像质量指标和展示他们的视觉报告中更容易解释的方式。pyfMRIqc也有广泛的在线文档,描述用户如何生成这些情节,他们表演,和艾滋病与例子的解释。pyfMRIqc的用户可以生成这些报告以最少的编程经验,只需要一行代码来运行软件,而不需要使用出口集装箱环境生成输出。作为工作的一部分了,我们另外的一个软件开发,“cinnqc”,我们使用自动化pyfMRIqc最小数据的预处理和管理,和确定情况下数据偏离预期的采集参数数据集。
先前的报道描述的使用两分的结构成像质量评估的可靠性数据(Backhausen et al ., 2016;埃斯特万et al ., 2017;Rosen et al ., 2018;Benhajali et al ., 2020)。例如,Benhajali et al。(2020)开发出一种快速评估方法的注册标准MNI T1加权图像空间。评级机构包括公民科学家们没有经验与核磁共振数据,以及评级机构专家。他们的协议导致良好的可靠性,尤其是对图像质量评估被认为失败,专家评分者之间,公民科学家还显示协议。因此这项研究表明,这种简单的方法来评估登记质量一致的个体间具有不同的技能水平。另一个协议之间的可靠性评估评级机构提出Backhausen et al。(2016),旨在提供一个工作流的质量控制评估之后T1影像图像采集有用的样本容量最大化。图像分为三类(通过,检查,不会失败),和这三个类别在大脑皮层与显著差异,左杏仁核灰质总额估计。可靠性两个评分者之间的三个分类类别高(内部类相关系数(α= 0.931)),符合的结果Rosen et al。(2018)时发现专家评分者之间的良好一致性三个类别评级系统(尽管尤其是一致性时显著降低使用五类)。最后,埃斯特万et al . (2017)温和的协议证明公平两个评级机构在评估之间的T1遵守数据集的数据的质量。这些研究表明,合理的可靠性预计会主观决策结构成像数据的质量,尤其是当使用三类分类数据。然而,在功能数据的情况下,尽管其潜在效用,两分的没有同样的可靠性评估来帮助理解主观决策数据质量的一致性。评估有经验的评级机构是否可靠的分类功能在数据集数据质量,我们使用fMRI数据开放质量控制项目,1其中包括数据与来自多个站点的不同采集参数。
我们评估了两分的功能磁共振成像数据质量评估的基于任务的可靠性和静止状态数据。我们描述定量和定性数据质量划分标准,提出了质量控制协议使用pyfMRIqc原始fMRI数据质量评估,评估可靠性之间的四个独立评级机构使用此协议,并提供例子的情况下使用来自pyfMRIqc输出不同的数据质量问题。评级机构机密数据分为三种评估类,“包括”“不确定,”或“排除。“用我们的协议,我们发现中度到评级机构之间的实质性的可靠性,特别是对于“包括”和“排除”的决定,但不确定分类评级机构之间达成协议。
材料和方法
参与者
图像数据的参与者
从129年受试者包括图像数据。每个主题有T1加权高分辨率解剖图像,和一个的单波段echo-planar成像(EPI)图像基于任务的或静息状态功能磁共振成像(fMRI)收购。基于任务的功能磁共振成像数据包括30科目。静息状态功能磁共振成像数据包括99例;静息状态的数据来源于五个网站,大约20科目/网站。数据来源于以下公开数据集:遵守,ABIDE-II功能连接体项目,OpenNeuro (Biswal et al ., 2010;Di马蒂诺et al ., 2014;Markiewicz et al ., 2021)。每个站点的数据被视为单独的数据集进行质量评估的目的。预期的采集参数归纳了每个站点的数据表1。这里给出的数据是可用的开放科学框架页面的功能磁共振成像质量控制项目(参见文本脚注1)开放。
质量控制评级机构
质量控制评估完成了四个独立的评级机构(BW,在北半球,CBM GMKR),谁都是博士后研究员,和所有评级机构在质量评估经验,功能神经影像数据的处理和分析。两家评级机构(BW和GR)之前使用pyfMRIqc执行质量评估的功能磁共振成像数据。此外,BW参与pyfMRIqc的发展。每个评定等级的审核数据的104 129例,使用输出从cinnqc和pyfMRIqc。主题任务确保至少有四个主题综述了每个站点的所有四个评级机构,以及其他主题被三大评级机构审查。作业也平衡,这样的比例在评级机构(见重叠的情况下是相等的补充资料表1评定等级的任务的细节)。
数据处理
解剖T1加权的最小预处理和功能性EPI数据都使用了目前工具箱(版本6.0)从牛津中心功能核磁共振成像的大脑(FMRIB的软件库2)(詹金森et al ., 2012)。数据预处理、管理和质量控制是自动使用“cinnqc。”3cinnqc提供包装器脚本的执行和策划输出目前预处理功能(例如,运动校正、登记和大脑提取),并生成pyfMRIqc最低限度预处理数据的报告。预处理数据,T1图像使用大脑头骨被提取工具(史密斯,2002),然后灰质、白质和脑脊液组织分割使用FMRIB执行的自动化分割工具(Zhang et al ., 2001)。运动功能EPI数据纠正MCFLIRT (詹金森et al ., 2002),使用仿射转换对齐功能数据与每个后续卷的第一卷。EPI功能和解剖T1数据然后使用epi_reg co-registered函数,4和一个线性仿射变换被用来将大脑功能的面具T1解剖图像中提取EPI空间使用FMRIB的线性图像配准工具(詹金森和史密斯,2001年;詹金森et al ., 2002)。大脑屏蔽功能EPI空间然后re-binarised使用一个阈值为0.5。图像质量指标和土地使用pyfMRIqc生成(威廉姆斯和林德纳,2020年)援助数据质量评估,例如,参与者的文物鉴定、序列、技术或组织。pyfMRIqc运行以下输入参数:- n > < EPI运动修正数据,- k - s 25日<大脑功能空间中提取的面具> - m <运动参数输出从MCFLIRT >。
资源
Ubuntu 20.04.4 LTS
目前版本6.0(参见文本脚注2)。
蟒蛇4.10.1
Python 3.8.8
•cinnqc 0.1.0
•easygui 0.98.3
3.3.4•matplotlib
•nibabel 3.2.1之上
•numpy 1.20.1
•熊猫4
质量评估协议
评级机构被赋予以下指令之前质量评估:
需要使用以下标准对所有图像进行分类5:
•不包括质量评估问题,显示数据集是有问题的。
•Uncertain-some质量评估问题,使得数据集包含的边际。
•Exclude-quality评估问题意味着数据不应包括在内。
每个图像分为“不确定”或“排除”应该包括一个解释为什么给定的分类。请解释你的决策时尽可能的描述。
质量评估决策应该支持的输出由cinnqc和pyfMRIqc。cinnqc和pyfMRIqc衍生品可以在网上找到的目录/ cinnqc /例子/ {fmriqc-open-qc-task, fmriqc -开- qc -休息- 100,fmriqc -开- qc -休息- 200,fmriqc -开- qc -休息- 300,fmriqc -开- qc -休息- 400,fmriqc -开- qc -休息- 500,fmriqc -开- qc -休息- 600,fmriqc -开- qc -休息- 700}/衍生品/ cinnqc / cinnqc GitHub的页面(见脚注文本3)。
定量数据评估
定量的质量评估标准T1和EPI数据基于采集参数和派生指标从数据中总结表1。阈值的绝对和相对运动,计算使用MCFLIRT,限制其对数据质量的影响。运动阈值表2和pyfMRIqc中总结报告。然而,即使亚阈值仍可能影响数据质量的运动。定性数据评估应检查是否有运动事件配合问题改变的信号。时间信号噪声(pyfMRIqc TSNR,称为信噪比)计算平均强度除以标准差的体素(25百分位数意味着强度)brain-extracted面具外的功能空间。它是由pyfMRIqc最低限度预处理数据计算。Slice-wise TSNR pyfMRIqc应该检查的报告,和潜在的问题片应遵循使用定性评估。视野、卷的数量和使用cinnqc扫描检查,和一个文件的后缀* _notes.txt生成描述任何潜在的问题。注意,一些体素维度由于舍入可能似乎是不同的,但如果他们都等于2位小数科目不需要被排除在外。T1和EPI数据应该覆盖整个大脑,包括大脑皮层和皮层下脑区(但不一定是小脑)。摘要定量评估标准中可以找到表2,预计收购的摘要参数中可以找到表1。
定性数据评估
pyfMRIqc生成大量的图和表,可以有助于数据的定性评估。均值和slice-wise比例的平方差异(SSD)平方来计算连续卷之间的立体像素强度的差异,并除以全球均方不同。在QC情节部分,意味着和slice-wise SSD图可以用来识别全球,分别和slice-wise信号强度的变化。SSD也是策划与全球正常化意味着立体像素强度、正常化SSD方差,加上绝对和相对运动想象SSD的变化之间的关系,信号强度和运动。此外,意思是,最小和最大SSD是绘制slice-wise确定问题是否出现在特定的切片。
的情节”是指体素时间与相同数量的垃圾箱的压是由体素分为50组不了了之,基于他们的平均强度,计算平均强度为每个卷体素在每一本。垃圾箱是命令自上而下从最低平均强度体素(non-brain /脑脊液)最高(灰质,白质压)。这个情节使信号方差和最初的简单的可视化描述电力(2017),也可以找到更多信息。
“面具”情节可以有助于表明收购或处理期间是否有问题(如大脑提取和/或注册的T1和EPI数据)。例如,可能有很多脑压不用蓝色突出显示。如果是这种情况,那么应该仔细检查扫描信号失真(在下面描述),或处理步骤可能需要手动重新运行与调整输入参数。可怜的登记(例如,失调总值的解剖结构包括大脑表面,或灰质、白质和脑脊液的界限)可能暗示其他的数据质量问题。
“体素强度方差”的情节展现的方差信号在每个timeseries的体素的功能运行。pyfMRIqc报告中给出的png图像阈值(立体像素强度分为1000等于宽度垃圾箱,而最高强度使用本至少有400像素点)来帮助可视化,然而nifti版本的形象还包括unthresholded。这nifti图像有助于更深入调查是否有潜在的质量问题或出现问题。“平方之和比例差异随着时间的推移,“情节介绍了voxel-wise和SSD的功能运行。类似于“压强度方差”的情节,我们应用一个阈值png图的可读性(分为50平方比例差异之和等于宽度垃圾箱,和上阈值使用的第五本),但nifti形象没有一个阈值。
检查数据信号失真,从主题的报价目录加载T1影像;EPI图像,加载图片后缀* _example-func.nii.gz从主题的cinnqc投标导数目录,意味着立体像素强度从pyfMRIqc nifti文件。如果视觉异常,这可能影响信号(例如,图像失真,信号损失,文物如振铃或重影),或处理(例如,大脑提取、登记、运动校正)T1或EPI数据。以确定这种情况下,故事情节从pyfMRIqc可以用来帮助主题分类。详细解释解释pyfMRIqc情节和表可以pyfMRIqc用户手册中找到。6的总结中可以找到质量评估标准表3。
评定等级的校准和可靠性评估
每个独立评定等级的评估和分类科目使用上面描述的质量评估协议。解释始终确保质量评估标准,BW质量评估协议用于确定问题和呈现这些范例科目训练情况下其他评级机构(表4)。
弗莱斯卡帕(弗莱斯,1971)是计算使用“irr”包R (玩家et al ., 2019)来评估评级机构之间的双向和category-wise两分的可靠性;为多个比较,我们使用了正确的河中沙洲方法控制family-wise错误率使用“p。调整“函数R (河中沙洲,1979;R核心团队,2020年)。我们选择使用弗莱斯kappa科恩kappa的,而是因为弗莱斯kappa也允许我们确定类似的双评级机构被计算在分类category-wise协议。我们使用描述的标准Landis和科赫(1977)解释弗莱斯的kappa使用以下标准来描述协议的力量:可怜的协议< 0.00;轻微的协议0.00 - -0.20;公平的协议0.21 - -0.40;温和的协议0.41 - -0.60;实质性的协议0.61 - -0.8;几乎完美的协议0.81 - -1.00。整体协议在评级机构和类别计算使用Krippendorffα(Krippendorff 1970),这是有用的作为一个衡量整体协议,因为它是不受限制的评级机构的数量或样本中存在缺失的数据(海耶斯和Krippendorff, 2007年)。Krippendorffα和引导95%置信区间(1000次迭代,抽样对象替换)计算的R使用脚本Zapf et al。(2016)。
结果
每个主题也归类为“包括”(评定等级:68年,评定等级二:73年,评定等级三:80年,评定等级的四:74),“不确定”(评定等级的评定等级:10日二:12,评定等级三:3,评定等级的四:9),或“排除”(评定等级的评定等级:26日二:19日估价者三:21日评定等级的四:20)由四个评级机构。评级机构之间的总百分比协议是总结表5。
两分的双评级机构之间可靠性计算使用弗莱斯Kappa;整体协议对评级机构是温和的和显著大于机会级别(评定等级1 - 2:κ= 0.536,z= 6.143,p< 0.001;评定等级1 - 3:κ= 0.437,z= 4.639,p< 0.001;评定等级1 - 4:κ= 0.456,z= 5.17,p< 0.001;评定等级2 - 3:κ= 0.448,z= 5.071,p< 0.001;评定等级的2 - 4:κ= 0.596,z= 6.818,p< 0.001;评定等级3 - 4:κ= 0.578,z= 6.022,p< 0.001)。Category-wise Kappa评级机构都是温和的和实质性的“包括”和“排除”作业分别和显著大于机会级别(包括:κ= 0.514,z= 6.661,p< 0.001;“排除”:κ= 0.731,z= 9.472,p< 0.001)。然而,这并非如此“不确定”作业,评级机构之间的协议是轻微(κ= 0.013,z= 0.166,p= 1.0)。我们也计算弗莱斯的Kappa category-wise对评级机构(图1)。所有评级机构有中度到实质性的协议,执行水平显著大于机会“包括”(评定等级1 - 2:z= 5.697p< 0.001;评定等级1 - 3:z= 3.849p< 0.001;评定等级1 - 4:z= 3.591p< 0.001;评定等级2 - 3:z= 4.409p< 0.001;评定等级的2 - 4:z= 5.269p< 0.001;评定等级3 - 4:z= 5.253p< 0.001)和“排除”(评定等级1 - 2:z= 5.405p< 0.001;评定等级1 - 3:z= 5.3p< 0.001;评定等级1 - 4:z= 6.645p< 0.001;评定等级2 - 3:z= 5.231p< 0.001;评定等级的2 - 4:z= 5.887p< 0.001;评定等级3 - 4:z= 6.525p< 0.001),而不是“不确定”(评定等级1 - 2:z= 1.471p= 1.0;评定等级1 - 3:z=−0.537p= 1.0;评定等级1 - 4:z= 1.0p= 0.716;评定等级2 - 3:z= 0.529p= 1.0;评定等级的2 - 4:z= 4.272p< 0.001;评定等级3 - 4:z=−0.415p= 1.0)作业(图1)。总体协议的数据集,如评估使用Krippendorffα为0.508(95%引导置信区间(0.381,0.615)];删除实例,“不确定”被分配增加Krippendorff 0.694的alpha引导(95%的置信区间(0.559,0.802)]。总共至少两个评分者97例归入包括6对象不确定,排除和26个科目。补充表1总结了subject-wise集团多数分类(“包括”/“不确定”/“排除”)。
质量控制标准的例子“排除”
数据采集的文物
成像收购文物被确定在五个科目由至少一个评定等级。这些问题包括重影(别名),振铃,概括文物(表6)。在图2我们提出这三个文物,与相关输出pyfMRIqc用来识别问题。第一主题,重影(别名)意味着功能图像从pyfMRIqc检测(海兰德,2008)。这能被探测到的视觉以外的杂散信号存在的周长。在第二种情况下,呈弧形的均值函数功能信号检测的图像(竞技场et al ., 1995)。概括时可以检测到的一部分头部分闭塞的视野。在这种情况下,大多数的后部分的头而不是出现在前部分的视觉形象,是最明显的轴向和矢状切片。第三例数据中包含平面文物由于眼球运动(McNabb et al ., 2020)。在这种情况下,立体像素强度的差异,再加上最大峰值和比例的平方之和的差异影响切片(特别是片15 - 17)表示的存在生理信号的变化无关。这些影响尤其明显在19 - 21卷,哪里有见顶的方差的平方之和的区别。一个视频片包含在闪烁的影响补充视频1。
运动
30个数据集划分为“排除”,至少一个评定等级的相关问题运动中描述的(表6)。在这些病例中,17超过可接受的值的绝对和相对运动(我们的量化标准表2)。其余病例列为“排除”基于运动的残余影响的数据,尽管运动的定量测量的亚阈值(Friston et al ., 1996)。这包括减少全球信号与运动的爆发事件(图4),加上在比例的平方达到顶峰的差异和条带被地毯图(图3;力量,2017)。
信号丢失
突然变化在全球信号可以使用pyfMRIqc在几个方面进行评估。例如,图4表明当运动文物导致全球突然减少信号(et al ., 2017年)。头部运动的发生在卷12和70年确定的峰均值和方差的平方差异加上扩展相对和绝对运动的总和,是立即紧随其后的正常化的意思是立体像素强度下降约两个标准差约十卷(图4)。带也被地毯的情节中,在信号突变配合所有箱子的强度的变化。六的审查对象被报道的至少一个信噪比相关问题四个评级机构,和十一被报道全球信号问题(表6)。
典型的大脑结构
两个对象被排除在外的一个评定等级的由于非典型的存在在T1加权图像解剖大脑结构(表6)。这两种情况下详细图5,一个主题一个右心室扩大,覆盖大于左心室的程度和我们通常期望心室封面。第二主题在左心室,一个意想不到的质量和hypointensities白质在整个大脑。我们无法评论这些解剖特点的临床意义,作者都没有临床专业知识。
不确定的情况下
27个受试者被分为“不确定”,至少一个评定等级;“不确定”用作21日由一个评定等级的分类主题,和不止一个评定等级的六个科目。受试者分为“不确定”的一个评定等级,其他两个/三个评级机构给了相同的分类(“包括”/“排除”)为20的21个科目;一个话题收到了一个“包括”,一个“不确定”和一个“排除”分类。其余6例,不止一个评定等级的分类主题为“不确定”,指出四个学科相关问题的存在残余运动表示,低于阈值,而其他两个科目的笔记显示在T1的存在可能的病理图像和功能数据混叠。最后,只有一个数据集被评为“不确定”的所有评级机构(图4),评级机构“不确定”的亚阈值的影响剩余运动数据。
讨论
这项工作旨在描述一个协议评估原始任务型的质量和使用pyfMRIqc静息状态功能磁共振成像数据,并评估的可靠性独立评级机构使用此协议分类数据对进一步分析是否符合可接受标准。我们使用fMRI数据开放QC项目[(参见文本脚注1),数据来自住,ABIDE-II,功能连接体项目,和OpenNeuro (Biswal et al ., 2010;Di马蒂诺et al ., 2014;Markiewicz et al ., 2021)]。总的来说,我们发现中等评级机构之间的协议,和温和的实质性category-wise协议评级机构包括/排除分类。穷,温和category-wise协议是不确定的分类,发现与可靠性显著大于水平只有一个对评级机构的机会。Krippendorffα的包括/排除所有评级机构类别足以暂时接受评级机构的分类是可靠的(Krippendorff 2004,p . 241)。我们还提供了示例为不同类型的质量问题被识别的数据集。
“不确定”分类我们发现有一个评级机构之间缺乏可靠性,两对评级机构有负面κ值,指示任何协议(麦克休2012),另外三双系数接近于0。评级机构之间缺乏可靠性的“不确定”分类似乎是由一个单一的不确定性评定等级的对于一个给定的主题。27个科目评为“不确定”的评定等级,21例(78%)没有其他评级机构评为“不确定”。6的对象认为“不确定”的不止一个评定等级,不确定性相关担忧运动(N= 4)、混叠(N= 2),和可能的病理(N= 2)。这包括一个主题(sub - 013)被所有评级机构作为“不确定”分类由于运动的残余影响,但其他类似的主题(例如,sub - 010和子- 016)是一致归类为“排除”尽管视觉相似的情节,和更少的最大绝对运动(图3)。在我们定量排除标准(表2),我们给明确的阈值的绝对和相对运动事件,尽管17/30排除数据集至少有一个评定等级被排除在外,因为超过我们的定量运动阈值,基于定性评估13/30被排除在外的运动对数据质量的影响。这些阈值是相对随意,尽管是一个有用的启发式,他们似乎没有捕获所有运动有不利影响的数据的情况。pyfMRIqc计数相对运动事件的数量>立体像素大小,0.5毫米和0.1毫米,尽管我们设置阈值相对运动事件的数量>根据以往的方针,体素的大小和0.5毫米7我们没有设定一个阈值> 0.1运动事件,但< 0.5毫米。在这种情况下,运动的亚阈值,但仍然是一个问题,持续的但是小运动事件会产生负面影响的数据我们不包括阈值小(0.1 < < 0.5)运动事件。然而,值得一提的是,评级机构只是最低限度了这里的数据预处理和,ica去噪等方法(Pruim et al ., 2015),将运动参数模型(Friston et al ., 1996),和删除卷受到运动的影响(et al ., 2012年),通常用于数据预处理,以减少运动的负面影响在fMRI信号数据。然而,尽管这些方法有利于清洗数据,否则可能会被丢弃,我们认为共识指南(联合国)可接受水平的运动需要提高一致性在神经影像社区,以同样的方式报价标准(Gorgolewski et al ., 2016)已被广泛采用事实上的数据格式结构。
重要的是要注意,尽管数据只是最低限度预处理,pyfMRIqc的目的不是确定数据处理步骤按预期工作,但数据本身的质量评估。我们运动修正数据,以便我们的指标(如比例的平方差异)计算相邻像素点的时间和空间,但我们不直接测量所有物理运动是否纠正。大脑提取、空间正常化、失真校正、去噪,都常用和重要的功能磁共振成像数据分析管道的预处理步骤,和这些预处理步骤的功效还应该检查的一部分,一个健壮的管道,以确保数据质量分析。因此,pyfMRIqc生成的输出应该被视为一个更广泛的数据处理过程的一部分。此外,由于生成的图像质量指标pyfMRIqc没有绝对引用——也就是说他们不能相比的参考价值,因为没有地面真理——数据质量问题的检测依赖于个人的解释。解决这个问题的一个方法是通过生成一个数据库的引用值异常值检测的援助。这是MRIQC所使用的过程,大佬图像质量度量生成群体分布(埃斯特万et al ., 2017)。然而,我们目前无法与pyfMRIqc生成这些发行版。
认知偏见也影响主观决策功能磁共振成像数据的质量。fMRI数据集的采集和准备涉及巨大的经济和时间成本,和研究人员可能会被这些动机更多的沉没成本最小化损失自己的数据,而不是次要的数据集。人们往往是损失厌恶(卡尼曼和特沃斯基,1979年),一想到“浪费”的资源投入获得数据集可以偏见个人认为数据质量问题不如独立如果数据收集问题。例如,波尔曼(2012)发现,人们在决策时更少的损失厌恶对他人与自己相比,这减少损失厌恶可能由于减少认知偏见对决策的影响。与他人相比,人们也不成比例的事情他们自己创造的价值(诺顿et al ., 2012),因此不愿放弃他们认为有价值的数据。重新评价是一种策略,可以被用来减少损失厌恶(Sokol-Hessner et al ., 2009,2013年),可以改善决策改变的角度丢弃数据浪费了资源的探测效果最大化能力,提高数据质量。采用开放的研究实践,如预先登记的数据质量控制程序和可接受阈值也可以减少偏见影响决策的风险,同时减少问题研究实践更普遍(你et al ., 2022)。然而这在神经影像尚未广泛采用社区(Borghi Gulick, 2018)。
有几个限制在这里提出的协议和软件。首先,我们发现,通常只有一个评定等级的分类数据集作为“不确定”表明,提出的质量控制协议(这是未经编辑出版的预评估状态),缺乏细节解释边界情况,否则将被分为“包含”或“排除。“鉴于pyfMRIqc最初旨在援助决策对原始/最低限度预处理功能磁共振成像数据的质量,我们建议未来用户宁可谨慎对标记的数据集的排斥,和第一次完全使用他们选择的管道预处理数据,然后确定这是否有一个积极的影响和减少数据质量问题。第二,cinnqc,扩展pyfMRIqc,不正式量化的成功最小的预处理步骤。在设计软件为用户以最小的编程经验,易用性的重视甚于功能可以减少更多的高级用户的自由。例如,大脑提取目前在目前使用默认参数识别大脑和non-brain组织(史密斯,2002)。这个过程有时会排除脑压(特别是在大脑的边界),或包括non-brain体素在大脑中提取的图像。然而,可以改善这些问题通过可选参数,改变默认值,但这需要微调per-subject基础上,或使用其他软件如HD-BET或ANTsX (Isensee et al ., 2019;Tustison et al ., 2021)。整合这些功能将改善的方法计算质量控制过程的再现性,目前用户需要生成这些文件分别和使用cinnqc命名将输出与其他管道。第三个限制是pyfMRIqc目前并不提供可视化的分布“不”图像质量指标。如前所述,目前MRIQC众包在缺省情况下,这些值从用户生成健壮的分布(埃斯特万et al ., 2017)。尽管pyfMRIqc目前没有用户为识别异常值这一种有效的方法在人口层面,想象这些值的分布至少组级别将帮助用户做出更明智的决定他们在样本数据的质量。pyfMRIqc的未来版本将通过专注于改善包括这些功能的软件,并且有可能整合引用值MRIQC web api为等效MRIQCEPTION指标以类似的方式8的工作原理。
总之,我们提供一个质量控制协议pyfMRIqc (威廉姆斯和林德纳,2020年),实现它在功能磁共振成像的数据开放质量控制项目(参见文本脚注1),并使用四个独立的评级机构评估其可靠性。数据被每一个评定等级的分类为“包括”,“不确定”或“排除”,基于协议和输出由pyfMRIqc cinnqc,自动最小的预处理,数据管理和倾斜的采集参数数据集的识别。我们的结果表明,可靠性评级机构之间对“包括”和“排除”的决定,与κ值范围从中度到实质性的协议。然而,系数之间的“不确定”分类展示小可靠性评级机构,和低于机会水平但一双评级机构。此外,我们发现,除了一个情况下,只有一个评定等级的“不确定”分类使用其他评级机构同意对方。我们建议改进评级机构之间的协议可以由咨询sample-wide分布图像质量的指标,增加了清晰的质量控制协议,并实现进一步分离预处理步骤之前重新评估数据,并决定是否将其排除在外”。
数据可用性声明
每个评定等级的质量控制报告中可以找到补充材料作为数据表3 - 6,大学阅读研究数据档案https://doi.org/10.17864/1947.000424。pyfMRIqc cinnqc GitHub上可以找到和cinnqc输出页面https://github.com/bwilliams96/cinnqc。
道德声明
伦理审查和批准没有所需的研究对人类参与者按照地方立法和制度的要求。书面知情同意参与这项研究并不需要按照国家法律和制度需求。
作者的贡献
BW:概念、方法、软件、正式的分析,调查,数据管理,原创作品草案,审查和编辑、可视化和项目管理。NH、CM和GR:方法,分析,审查和编辑。AC:资源、监督和审查和编辑。所有作者的文章和批准提交的版本。
的利益冲突
作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。
出版商的注意
本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。
补充材料
本文的补充材料在网上可以找到:https://www.雷竞技rebatfrontiersin.org/articles/10.3389/fnins.2023.1070413/full补充材料
脚注
- ^https://osf.io/qaesm/
- ^www.fmrib.ox.ac.uk目前
- ^https://github.com/bwilliams96/cinnqc
- ^https://fsl.fmrib.ox.ac.uk/fsl/fslwiki/FLIRT/UserGuide epi_reg
- ^附加信息的分类没有协议但由评级机构同意:
•包括情况下能通过所有定量和定性质量控制标准及pyfMRIqc情节或手动检查的数据不会显示任何数据问题。
•不确定的情况下能通过所有定量的质量控制标准,但pyfMRIqc情节或手动检查数据的数据可能表明边际问题可以排除。
•排除病例会失败至少有一个定量的质量控制标准,和/或pyfMRIqc情节或手动检查数据显示数据质量问题,保证排斥。
- ^https://drmichaellindner.github.io/pyfMRIqc/
- ^https://cbs.fas.harvard.edu/facilities/neuroimaging/investigators/mr-data-quality-control/
- ^https://github.com/elizabethbeard/mriqception
引用
Alfaro-Almagro F。詹金森,M。,Bangerter, N. K., Andersson, J. L. R., Griffanti, L., Douaud, G., et al. (2018). Image processing and quality control for the first 10,000 brain imaging datasets from UK Biobank.科学杂志166年,400 - 424。doi: 10.1016 / j.neuroimage.2017.10.034
舞台上,L。,Morehouse, H. T., and Safir, J. (1995). MR imaging artifacts that simulate disease: How to recognize and eliminate them.射线照相15日,1373 - 1394。doi: 10.1148 / radiographics.15.6.8577963
Backhausen, L . L。懂得,M . M。Buse, J。,Roessner, V., Smolka, M. N., and Vetter, N. C. (2016). Quality control of structural MRI images applied using freeSurfer–A hands-on workflow to rate motion artifacts.前面。>。10:558。doi: 10.3389 / fnins.2016.00558
Benhajali Y。Badhwar,。施皮尔,H。厄奇,S。,Armoza, J., Ong, T., et al. (2020). A standardized protocol for efficient and reliable quality control of brain registration in functional MRI studies.前面。Neuroinformatics14:7。doi: 10.3389 / fninf.2020.00007
∙B, B。梅恩,M。、左X.-N。、Gohel年代。凯利,C。,Smith, S. M., et al. (2010). Toward discovery science of human brain function.Proc。国家的。学会科学。美国107年,4734 - 4739。doi: 10.1073 / pnas.0911855107
Borghi, j . A。,和Gulick, A. E. V. (2018). Data management and sharing in neuroimaging: Practices and perceptions of MRI researchers.《公共科学图书馆•综合》13:e0200562。doi: 10.1371 / journal.pone.0200562
Casey b J。,Cannonier, T., Conley, M. I., Cohen, A. O., Barch, D. M., Heitzeg, M. M., et al. (2018). The adolescent brain cognitive development (ABCD) study: Imaging acquisition across 21 sites.Dev Cogn。>。32,43-54。doi: 10.1016 / j.dcn.2018.03.001
Di马蒂诺。燕,C.-G。李,问。,Denio, E., Castellanos, F. X., Alaerts, K., et al. (2014). The autism brain imaging data exchange: Towards a large-scale evaluation of the intrinsic brain architecture in autism.精神病学摩尔。十九章。doi: 10.1038 / mp.2013.78
埃斯特万,O。,Birman, D., Schaer, M., Koyejo, O. O., Poldrack, R. A., and Gorgolewski, K. J. (2017). MRIQC: Advancing the automatic prediction of image quality in MRI from unseen sites.《公共科学图书馆•综合》12:e0184661。doi: 10.1371 / journal.pone.0184661
Friston, k . J。威廉姆斯,S。,霍华德,R。,Frackowiak, R. S. J., and Turner, R. (1996). Movement-Related effects in fMRI time-series.粉剂。的原因。地中海。35岁,346 - 355。doi: 10.1002 / mrm.1910350312
游戏玩家,M。,Lemon, J., and Singh, I. F. P. (2019).irr:各种评分者间信度系数和协议。https://CRAN.R-project.org/package=irr(2022年10月14日访问)。
Gorgolewski, k . J。奥氏小体,T。,Calhoun, V. D., Craddock, R. C., Das, S., Duff, E. P., et al. (2016). The brain imaging data structure, a format for organizing and describing outputs of neuroimaging experiments.科学。数据3:1。doi: 10.1038 / sdata.2016.44
海耶斯,a F。,和Krippendorff, K. (2007). Answering the call for a standard reliability measure for coding data.Commun。量的方法。1,77 - 89。doi: 10.1080 / 19312450709336664
Isensee F。,Schell, M., Pflueger, I., Brugnara, G., Bonekamp, D., Neuberger, U., et al. (2019). Automated brain extraction of multisequence MRI using artificial neural networks.嗡嗡声。攻读硕士学位的大脑。40岁,4952 - 4964。doi: 10.1002 / hbm.24750
詹金森,M。,和Smith, S. (2001). A global optimisation method for robust affine registration of brain images.地中海。图像肛门。5,143 - 156。doi: 10.1016 / s1361 - 8415 (01) 00036 - 6
詹金森,M。,Bannister, P., Brady, M., and Smith, S. (2002). Improved optimization for the robust and accurate linear registration and motion correction of brain images.科学杂志17日,825 - 841。doi: 10.1016 / s1053 - 8119 (02) 91132 - 8
詹金森,M。,Beckmann, C. F., Behrens, T. E., Woolrich, M. W., and Smith, S. M. (2012). FSL.科学杂志62年,782 - 790。doi: 10.1016 / j.neuroimage.2011.09.015
卡尼曼,D。,和Tversky, A. (1979). Prospect theory: An analysis of decision under risk.费雪47:263。doi: 10.2307 / 1914185
兰迪斯,j . R。,和Koch, G. G. (1977). The measurement of observer agreement for categorical data.生物识别技术33岁,159 - 174。doi: 10.2307 / 2529310
马库斯·d·S。,Harms, M. P., Snyder, A. Z., Jenkinson, M., Wilson, J. A., Glasser, M. F., et al. (2013). Human connectome project informatics: Quality control, database services, and data visualization.科学杂志80年,202 - 219。doi: 10.1016 / j.neuroimage.2013.05.077
Markiewicz c J。,Gorgolewski, k . J。法因戈尔德F。布莱尔,R。,Halchenko, Y. O., Miller, E., et al. (2021). The openNeuro resource for sharing of neuroscience data.Elife10:e71774。doi: 10.7554 / eLife.71774
McNabb, c, B。林德纳,M。沈,S。,Burgess, L. G., Murayama, K., and Johnstone, T. (2020). Inter-slice leakage and intra-slice aliasing in simultaneous multi-slice echo-planar images.大脑结构。功能。225年,1153 - 1158。doi: 10.1007 / s00429 - 020 - 02053 - 2
你,G。,Botvinik-Nezer, R., Appelhoff, S., Vega, A. D. L., Esteban, O., Etzel, J. A., et al. (2022). Open and reproducible neuroimaging: From study inception to publication.科学杂志263:119623。doi: 10.1016 / j.neuroimage.2022.119623
诺顿,我m。莫聪,其D。,和Ariely, D. (2012). The IKEA effect: When labor leads to love.j . Consum。Psychol。22日,453 - 460。doi: 10.1016 / j.jcps.2011.08.002
权力,j . D。,Barnes, K. A., Snyder, A. Z., Schlaggar, B. L., and Petersen, S. E. (2012). Spurious but systematic correlations in functional connectivity MRI networks arise from subject motion.科学杂志59岁,2142 - 2154。doi: 10.1016 / j.neuroimage.2011.10.018
权力,j . D。Plitt, M。,Laumann, T. O., and Martin, A. (2017). Sources and implications of whole-brain fMRI signals in humans.科学杂志146年,609 - 625。doi: 10.1016 / j.neuroimage.2016.09.038
Pruim, R·h·R。梅恩,M。,van Rooij, D., Llera, A., Buitelaar, J. K., and Beckmann, C. F. (2015). ICA-AROMA: A robust ICA-based strategy for removing motion artifacts from fMRI data.科学杂志112年,267 - 277。doi: 10.1016 / j.neuroimage.2015.02.064
罗森,a·f·G。、Roalf d R。Ruparel, K。,布莱克,J。,Seelaus, K., Villa, L. P., et al. (2018). Quantitative assessment of structural image quality.科学杂志169年,407 - 418。doi: 10.1016 / j.neuroimage.2017.12.059
Sokol-Hessner, P。,卡默勒,c F。,和Phelps, E. A. (2013). Emotion regulation reduces loss aversion and decreases amygdala responses to losses.Soc。Cogn。影响。>。8,341 - 350。doi: 10.1093 /扫描/ nss002
Sokol-Hessner, P。许,M。,Curley, N. G., Delgado, M. R., Camerer, C. F., and Phelps, E. A. (2009). Thinking like a trader selectively reduces individuals’ loss aversion.Proc。国家的。学会科学。美国106年,5035 - 5040。doi: 10.1073 / pnas.0806761106
Tustison: J。,做饭、p。,Holbrook, A. J., Johnson, H. J., Muschelli, J., Devenyi, G. A., et al. (2021). The ANTsX ecosystem for quantitative biological and medical imaging.科学。代表。第十一章。doi: 10.1038 / s41598 - 021 - 87564 - 6
冯·迪,k . r . A。、Sabuncu m R。,和Buckner, R. L. (2012). The influence of head motion on intrinsic functional connectivity MRI.科学杂志59岁,431 - 438。doi: 10.1016 / j.neuroimage.2011.07.044
范·埃森,d . C。,史密斯,s M。Barch, d . M。,Behrens, T. E. J., Yacoub, E., and Ugurbil, K. (2013). The WU-minn human connectome project: An overview.科学杂志80年,62 - 79。doi: 10.1016 / j.neuroimage.2013.05.041
威廉姆斯,B。,和Lindner, M. (2020). pyfMRIqc: A software package for raw fMRI data quality assurance.j .打开Softw》。8:1。doi: 10.5334 / jors.280
Zapf,。,Castell, S., Morawietz, L., and Karch, A. (2016). Measuring inter-rater reliability for nominal data – which coefficients and confidence intervals are appropriate?BMC医学研究Methodol >。16:93。doi: 10.1186 / s12874 - 016 - 0200 - 9
关键字功能磁共振成像:静息状态功能磁共振成像,功能磁共振成像任务,质量控制,两分的可靠性
引用:威廉姆斯B,骑墙派N, McNabb CB,罗赛蒂GMK和Christakou(2023)两分的功能磁共振成像数据质量控制的可靠性评估:一个标准化的协议并使用pyfMRIqc实用指南。前面。>。17:1070413。doi: 10.3389 / fnins.2023.1070413
收到:2022年10月14日;接受:2023年1月11日;
发表:2023年2月3日。
编辑:
丹尼尔·r·格伦国家心理健康研究所(NIH),美国版权McNabb©2023威廉姆斯,骑墙派,罗赛蒂和Christakou。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。
*通信:布伦丹·威廉姆斯,b.williams3@reading.ac.uk
__这些作者贡献了同样的工作