跳转到主要内容

方法的文章

前面。Bioinform。,03 February 2023
计算BioImaging秒。
卷3 - 2023 | https://doi.org/10.3389/fbinf.2023.1073918

羽毛增长的计算机视觉量化框架模式

www.雷竞技rebatfrontiersin.org泰勒n·汤普森 1*,www.雷竞技rebatfrontiersin.org安娜·维克瑞2,www.雷竞技rebatfrontiersin.org迈克尔·d·夏皮罗 2www.雷竞技rebatfrontiersin.org爱德华许1
  • 1犹他大学生物医学工程系,盐LakeCity、UT、美国
  • 2犹他大学生物科学学院的盐LakeCity、UT、美国

羽毛的增长模式是重要的解剖表型研究的潜在基因调控皮肤表皮附属物发展。然而,羽毛增长模式的描述之前依靠手动检查和视觉检查,这几乎都是主观的,对大样本的大小。在这里,我们报告一个新的高通量技术量化的位置和空间范围逆转羽毛组成国内鸽子头波峰。表型变异鸽子羽毛增长模式呈现的计算机断层扫描(CT)扫描点云。然后,我们开发了基于机器学习的,特征提取技术孤立的羽毛,和地图的增长模式在皮肤上定量,自动化和非侵入性的方式。结果从五个实验动物都是在良好的协议与“地面实况”结果通过目视检查,这表明该方法的可行性羽毛生长模式的量化。我们的发现强调了潜力,越来越不可或缺的作用现代计算机视觉和机器学习技术的生物的生物学和遗传学的接口。

1介绍

动物形态的变化通常有一个遗传起源。例如,许多鸟类展览不同模式的波峰,羽毛显示与通信相关结构和求爱(普鲁姆1999;阿蒙森,2000;价格,2002)。国内岩石鸽子(鸽属利维亚负责人)波峰的特点是羽毛的头部和颈部,其增长极性是相反的:正常的背侧腹侧和背腹侧,导致一根羽毛,曲线向头顶而不是下来,远离它(图1)。头波峰鸽子中不同品种在羽毛的大小和空间范围(图2)。EphB2基因的一种变体似乎头嵴形成所必需的,但这个基因还不足以解释所有的定量和定性的变化头整个物种的波峰(夏皮罗et al ., 2013)。因此,头部波峰形态的定量评估是必不可少的发现额外的基因控制波峰变异。识别这些基因,反过来,将扩大我们的理解的遗传和发育机制,监管模式和增长在脊椎动物皮肤附属物(例如,羽毛、头发、尺度)。

图1
www.雷竞技rebatfrontiersin.org

图1。单一的羽毛的示意图。一般来说,一根羽毛(左)由刚性中心轴,叫做脊柱,支持软扇形叶片,由联锁冷嘲热讽。羽毛的极性可以数学建模和确定角度αα′由切线的技巧和基本的脊柱,分别和皮肤表面的平面。一根羽毛可分为正常(中心)或基于Δ是否反向极性(右)α=αα′是积极的还是消极的。

图2
www.雷竞技rebatfrontiersin.org

图2。国内岩石鸽子的头冠表型。与一只鸽子没有头冠(左),冠鸽子的特点是一片羽毛与反极性头部和颈部的皮肤(右)。信贷:麦考利库在康乃尔大学鸟类学实验室(ML61674401),悉尼斯特林汉姆。

羽毛有很长的历史在发育生物学作为经济增长的模型,模式,区域皮肤身份(布尔et al ., 2017)。然而,研究成人羽毛的模式和形态很大程度上依赖于繁琐的手动检查和视觉检查个人的羽毛。测量大片或补丁的羽毛可以高度劳动密集型、费时,而且容易出错。这些挑战使一项研究的作者得出结论,“羽毛计数的工作是乏味的和严格的和产量小的结果相对于所涉及的劳动”(1936年,惠特玛)。理想的方法研究羽毛应该基于非侵入性成像模式,它允许形态信息捕获原位,没有干扰的羽毛或删除。此外,应定量的方法,测量可以方便地集成到数据科学分析管道进行基因和基因组分析地图的基因变异的控制。例如,了解岩石鸽子,头冠变异最相关的测量位置、密度、皮肤和程度的头部和颈部羽毛和反极性生长。基因映射项目通常需要大量的动物健壮的统计支持,(香港公园,2012年)所以羽毛图案的分析也应该足够快,fully-automatable。

在这里,我们提出一个方法来量化羽毛模式,利用(a)非侵入性的计算机断层扫描(CT)成像,(b)基本后处理图像转换为点云表示捕捉皮肤和羽毛的形态,(c)集群和机器学习分析分离和识别个人的羽毛,和(d)数值程序量化羽毛曲率和推断了羽毛的位置和面积。我们的结果,验证了视觉检验,证明了可行性和实用性相结合的成像和机器视觉实现曾经认为是几乎不可能的分析。我们预计我们的方法将鸟类生物学之外各领域有广泛的实用程序。

2材料和方法

2.1图像采集

CT获取组织的密度和材料,并已用于鸟类(琼斯等人。,2019年;布尔et al ., 2021),尽管扫描优化主要用于内部硬组织解剖学。可视化的羽毛是具有挑战性的由于他们的低辐射不能透过。在目前的研究中,刚牺牲国内摇滚鸽子(n= 8)仔细处理保护头部和颈部的天然构象与羽毛,最小扰动和扫描50μm分辨率使用小动物CT (Inveon,西门子临床成像)工具。采集设置,其中包括30千伏x射线的能量相对较低,但500年高电流μA经验,决心提供最大的羽毛和周围空气之间的对比。扫描然后重建使用标准Feldkamp Shepp-Logan滤波算法(1979年Gullberg说道),转换为Houndsfield而言单位(胡)。

2.2解剖表示

进行后处理和分析都是一个Linux工作站配备一个AMD Ryzen 1900 x 4.0 GHZ CPU, 64 GB的RAM和NVIDIA GTX 2080 - ti图形卡。作为后分析的第一步,CT扫描的解剖特点需要代表数学(例如,转换成3 d坐标点)来促进他们的定量表征。虽然这可以完成通过几种不同的方法,我们呈现CT体积等值面使用阿米拉和经验决定强度范围,binarizing强度窗口内的数据。然后,我们生成的点云组成的多边形顶点的等值面。表面元素的坐标点获得使用高强度阈值(200−胡)分组直接点云表示“皮肤”。相比之下,“一切”点云是使用生成的低阈值(860−胡)来消除背景噪音。随后,“皮肤”是排除在“一切”形成了“羽毛”的点云,通过删除点在“一切”云接近顶点的“皮肤”云。剩下的“羽毛”云包含主要羽毛脊柱,和残余图像噪声和工件。

2.3集群隔离和标识

在定量形态学特征之前,另一个必要步骤是确定和隔离与个人相关的点簇羽毛的“羽毛”的点云,不仅含有脊柱,而且成像工件和unremoved图像噪声。幸运的是,类似于基于解剖邻近目视检查,孤立点的羽毛可以接近或密度的点。为此,分层的python实现Density-Based空间聚类的应用程序与噪声(HDBSCAN)算法(Campello et al ., 2013;麦克因尼斯et al ., 2017)是用于识别的点与每个不同的对象相关联。聚类算法应用于前面提到的“羽毛”的点云,使用默认的算法参数引用的实现除了最小允许集群大小设置为50分。点云是内在无序,确定集群索引,下令对距离“皮肤”的点云。每个索引集群被压缩到10等距的点沿着索引位置的平均空间维度。这个过程中演示图5。将每个集群分类为“羽毛”或“羽毛”,单一通道卷积神经网络组成的三卷积层之后,六层分类网络与漏ReLU Pytorch激活函数是实现(亚当et al ., 2019)。每个子样品的集群是由三个组成的数组表示为10的规范化xyz坐标的10分。生成模型的训练数据,三只鸟(一个冠,两个un-crested)进行扫描和处理点云。这个过程花了18 h,并生成大约30000集群,其中22000被用来训练模型,剩下的8000人用于测试。在训练时,模型训练120时代,更新按照默认Pytorch ADAM优化算法的实现和评估测试集群,在不到2个小时。

2.4形态量化

分离和鉴定后与个人相关的点簇羽毛,可以获得所需的形态量化数值。的极性标识的羽毛是通过计算线性近似羽毛的顶部和底部了图1使用中演示的凝聚点图5。使用前三的两个线性近似计算和底部三分的凝聚点,和用于推断交集点的角度αα′可以确定。这些交叉角度相互进行比较生成Δα术语。随后,羽毛被贴上“正常”或“反向”极性,取决于Δα分别是积极的还是消极的。此外,羽毛底部的外推点被用来确定插入点的羽毛在皮肤表面。羽毛的插入点与反向极性被用来计算当地波峰羽毛密度在皮肤表面坐标。最后,羽毛的皮肤区域密度大于7的经验确定阈值 羽毛 厘米 2 摄头波峰面积。

2.5性能评估

我们的羽毛模式分析框架的性能是评价两个方面。集群分类的准确性是评价8000集群测试集的手贴上。其次,分析管道的最终输出(皮肤的地区被反向极性生长模式)是评价5日鸟分开训练的集群的派生。执行评估,集群“羽毛”点云的每一只鸟都是手动标记(采取6 h /鸟手标签的每个集群),并计算极性验证。手动验证数量,其余要映射的过程进行反向极性的地区。然后计算intersection-over-union这个区域与区域之间由完全自动化的过程。作为一个控制,同样的程序做了两个额外的鸟类没有头波峰来验证没有区域标识。

3的结果

一个代表性的CT图像显示了一只鸽子头部和颈部图3。正如所料,捕获的图像内部解剖的精致的细节(例如,骨头)。相比之下,轴的羽毛,背景噪音和工件有类似的低强度,这凸显了后续分析的困难,但并非不可能的任务。图4显示了一个点云解剖isourface和用于集群和形态分析,这些集群被归类为是一个羽毛,显示在集群标识为羽毛图5在绿色,而皮肤用白色表示,该地区和决心在红色反向极性。图6显示了一个代表羽毛和non-feather点集群在通关环节处理的三个阶段,分别检测、排序,和二次抽样从左到右。当前分析的最终输出管道,这是inverted-polarity羽毛和二进制区域的密度地图表示的波峰位置和程度,所示图7,8分别冠和non-crested鸟。

图3
www.雷竞技rebatfrontiersin.org

图3。CT扫描的岩鸽。一个矢状切片显示正常(左)和饱和(右)强度尺度。倒轴的羽毛(绿色箭头),和传统的羽毛(红色箭头)视觉效果明显,但很难区分背景噪音和工件。

图4
www.雷竞技rebatfrontiersin.org

图4。代的形态点集群。低强度阈值应用于获得“一切”等值面(上),其顶点被用来形成相应的点云。“皮肤”点云(图中未显示)也同样获得了使用高强度的阈值。“羽毛”的点云(底部)是由不含“一切”的“皮肤”云。集群对应单个对象识别的点云所示不同的颜色。等值面呈现(上),扫描仪的矩形结构底部部分动物床,和分散的小物件上方和下方的补丁,和底部的脖子,成像噪音和工件。注意,上面的等值面生成强度略高,删除一些噪声出现在下面点云来更好地显示的羽毛被确定。在管道的实现,分等值面和点云完全匹配。

图5
www.雷竞技rebatfrontiersin.org

图5。示例集群分为羽毛(绿色),皮肤点云(白色),反向极性(红色)的地区。

图6
www.雷竞技rebatfrontiersin.org

图6。排序和业者的羽毛识别单个集群。顶部和底部面板对应代表羽毛和non-feather集群。未分类的集群(左)是按距离排序对羽毛的一端,然后falsecolor编码的可视化,业者(右)。尽管减少点的数量的每个对象,羽毛的基本特征仍可辨认的。

图7
www.雷竞技rebatfrontiersin.org

图7。决心和可视化的波峰。使用等值面呈现(左)皮肤和羽毛轴作为参考,羽毛的密度与反曲率所示falsecolor(中心)。这里定义的波峰,作为地区inverted-feather密度大于7羽毛每平方厘米,通过简单的阈值密度和显示为一个二进制映射(右)。

图8
www.雷竞技rebatfrontiersin.org

图8。一位代表鸟没有波峰作为控制。特写的CT等值面呈现了羽毛,都有正常的极性(左)。自动图像分析管道没有发现任何波峰面积(右)。

作为性能指标,在8000个人集群相比,自动(即。,machine learning) classification correctly identified the feather clusters 86.0% of the time, while producing 4.5% and 9.4% false-positive and false-negative identifications, respectively. Although the accuracy could likely be improved by additional training data, more sophisticated algorithms, and additional training, the performance was deemed acceptable for characterizing the collective behavior of regions of feathers (例如,密度和面积逆转羽毛)而不是个人羽毛极性。第二个测试的性能,十字路口在联盟计算5鸟,三个波峰,和两个没有。图9显示了一个代表比较峰值区通过电脑和目视检查。三冠鸟检查,自动和visually-determined嵴区域重叠的平均95.0%±3.1%(平均值±标准平均误差)。相比之下,没有发现波峰面积的两只动物没有峰值,如预期。在一起,这些发现表明,我们建议的框架,羽毛特性是高度准确、可靠。

图9
www.雷竞技rebatfrontiersin.org

图9。验证确定波峰区域代表鸟。顶视图的波峰区域由计算机(左)和视觉检查(中心)是栗色和黄色所示,分别在皮肤表面呈现蓝色。的重叠区域橙色(右)所示。对于这个特定的动物,电脑确定波峰面积略小(4%)比,通过视觉检查。

的计算性能,整个分析(从点云创建映射的增长模式)花了大约4.8分钟每只鸟在我们适度的计算设置。超出了最初的经验确定计算参数(如强度阈值水平),分析了在一个完全自动化的时尚没有额外的用户输入。

4讨论

我们应用计算机视觉和机器学习技术分析羽毛形态从鸽子的CT图像,和量化的位置和面积的波峰。结果是在良好的协议与当前“黄金标准”通过视觉检查。值得re-iterating,虽然这种方法只适用于一种鸟类,我们没有理由看到这项技术不应该适用于不同物种也表现出波峰增长模式,并且可以适应量化不同的增长模式。

扣除的初始经验确定参数,和标签训练数据的集群识别模型,整个自动分析和花了不到5分钟处理时间对我们适度的工作站。CT扫描和重建相比57岁和23分钟,分别分析不会成为瓶颈大容量和高通量项目。据我们所知,这是第一次,羽毛生长模式的分析是成功地进行非侵入式的、定量和完全自动化的时尚。

为了使这种方法是可行的,所映射的结构必须满足两个主要条件。他们必须存在于radio-opacity阈值,这样就可以呈现为一个等值面,和被分离成单个结构通过聚类或一些类似的方法。除了在羽毛,阐明可量化的指标可能有这种技术的适用性与其他拓扑类似的场景,满足标准。限制讨论生物场景中,有很多的例子,这些所谓的“成长”结构在不同组织类型直接生长在另一个之上。例如,骨肉瘤恶性肿瘤长在骨头的表面(Widhe Widhe, 2000;辊et al ., 2018)。同样,佩吉特氏病的特点是脊椎软骨和纤维产物结构(赛和哈桑,2003)。量化的技术我们已经开发了羽毛的形态生长的皮肤可能是一个可行的方法来识别和量化这些类型的生物生长的形态结构特征是一种组织类型增长立即下到另一个地方。

尽管结果是鼓舞人心的,当前的研究有几个潜在的局限性。首先,通过比较结果验证了通过视觉检查。虽然目前生产最好的“真理”,目视检查必然是主观的,及其labor-intensiveness限制比较几乎可以执行的数量。第二,我们的机器学习算法的准确性对于识别羽毛是一个温和的86%,和准确性直接决定他们的极性没有评估。虽然我们目前的输出(即。,the overall location and area of the head crest) appear not to have been adversely impacted, these limitations may need to be addressed in other applications. One notable approach could be通过额外的训练数据(更多的手贴上集群)或数据增大。早期版本的集群基于机器学习的分类、使用数据增强了,但为了使鸟类的方法的相对位置的扫描仪,羽毛,位置和计算稳定性,xyz点用于分类规范化。这个归一化数据增加旋转的最直接的方法,翻译,扩张集群不代表实际的数据。在未来的工作中,或更高的精度在集群识别任务是必要的,更复杂的数据扩增方法当然可以被探索。

最后,作为图像分析,管道的性能高度依赖于输入图像的质量和使用的方式。当前的研究之后才可能最大化的最优CT协议的对比的羽毛脊柱CT图像确定。成像和分析管道可能需要为每个不同的应用程序在个案基础上进行了优化。

数据可用性声明

原始数据支持了本文的结论将由作者提供,没有过度的预订。

道德声明

动物研究回顾和批准犹他大学制度动物保健和使用委员会。IACUC协议数量:16 - 03010和19 - 02011。

作者的贡献

相应的作者构思的方法,并得到了咨询和支持第二作者。

资金

这项工作是由美国国立卫生研究院的资助R35GM131787 MDS。

确认

这个手稿的内容提出了部分在2020年国际会议上计算科学和计算智能:t·汤普森,A .维克瑞·m·夏皮罗和e .许“羽毛增长的计算机视觉量化框架模式,“2020年国际会议上计算科学和计算智能(去找找CSCI), 2020年,页1688 - 1690,doi: 10.1109 / CSCI51800.2020.00311

的利益冲突

作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。

出版商的注意

本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。

引用

亚当,P。,Gross, S., Massa, F., Adam, L., James, B., Chanan, G., et al. (2019). “Pytorch: An imperative style, high-performance deep learning library,” in先进的神经信息处理系统,8024 - 8035。编辑h .瓦拉赫,h . Larochelle a . Beygelzimer Alche-Buc f . d, e·福克斯和r·加内特(Curran Associates Inc .))。可以在:http://papers.neurips.cc/paper/9015-pytorch-an-imperative-style-high-performance-deep-learning-library.pdf

谷歌学术搜索

阿蒙森,t (2000)。为什么雌鸟装饰?生态发展趋势。另一个星球。15 (4),149 - 155。doi: 10.1016 / s0169 - 5347 (99) 01800 - 5

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

布尔,e . F。,Van Hollebeke, H. F., Maclary, E. T., Holt, C., Yandell, M., and Shapiro, M. D. (2021). A ROR2 coding variant is associated with craniofacial variation in domestic pigeons.咕咕叫。医学杂志。31日(22日),5069 - 5076. - e5。doi: 10.1016 / j.cub.2021.08.068

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

布尔,e . F。,Van Hollebeke, H. F., and Shapiro, M. D. (2017). Genomic determinants of epidermal appendage patterning and structure in domestic birds.Dev,杂志。429 (2),409 - 419。doi: 10.1016 / j.ydbio.2017.03.022

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Campello, r·j·g·B。Moulavi D。,和Sander, J. (2013). “Density-based clustering based on hierarchical density estimates,” in亚太会议知识发现和数据挖掘(施普林格),160 - 172。

CrossRef全文|谷歌学术搜索

Gullberg说道g . t . (1979)。通过过滤投影重建扇形波束数据。第一版。图。图像的过程。10 (1),30-47。doi: 10.1016 / 0146 - 664 x (79) 90033 - 9

CrossRef全文|谷歌学术搜索

在香港,e . P。,和Park, J. W. (2012). Sample size and statistical power calculation in genetic association studies.基因组学和正无穷。10 (2),117 - 122。doi: 10.5808 / gi.2012.10.2.117

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

琼斯·m·e·H。、按钮、d J。,Barrett, P. M., and Porro, L. B. (2019). Digital dissection of the head of the rock dove (columba livia) using contrast-enhanced computed tomography.黑旋风。列托人。5 (1),17-31。doi: 10.1186 / s40851 - 019 - 0129 - z

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

麦克因尼斯,L。希利,J。,和Astels, S. (2017). hdbscan: Hierarchical density based clustering.j .开源Softw。2 (11),205。doi: 10.21105 / joss.00205

CrossRef全文|谷歌学术搜索

价格,t . d . (2002)。驯养的鸟作为物种形成的遗传模型性选择。遗传116 (2),311 - 327。doi: 10.1023 /: 1021248913179

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

普鲁姆,r . o . (1999)。发展和羽毛的进化起源。j . Exp。动物学285 (4),291 - 306。doi: 10.1002 / (sici) 1097 - 010 x (19991215) 285:4 < 291: aid-jez1 > 3.0.co; 2 - 9

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

辊、l。Chebib,我。,Bredella, M. A., and Chang, C. Y. (2018). Clinical, radiological, and pathological features of extraskeletal osteosarcoma.Skelet。Radiol。47 (9),1213 - 1220。doi: 10.1007 / s00256 - 018 - 2908 - 6

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

赛,一个。,和Hassan, A. (2003). Paget’s disease of the spine: Unusual features and complications.中国。Radiol。58 (2),102 - 111。doi: 10.1053 / crad.2002.1152

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

夏皮罗,m D。,Kronenberg, Z., Li, C., Domyan, E. T., Pan, H., Campbell, M., et al. (2013). Genomic diversity and evolution of the head crest in the rock pigeon.科学339 (6123),1063 - 1067。doi: 10.1126 / science.1230422

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

惠特玛,a (1936)。的轮廓羽毛passeriform和相关的鸟类。53 (2),159 - 169。doi: 10.2307 / 4077274

CrossRef全文|谷歌学术搜索

Widhe B。,和Widhe, T. (2000). Initial symptoms and clinical features in osteosarcoma and ewing sarcoma.JBJS82 (5),667 - 674。doi: 10.2106 / 00004623-200005000-00007

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

关键词:机器学习、聚类方法、特征提取,bioimaging、点云处理

引用:汤普森TN,维克里,夏皮罗博士和徐E(2023)计算机视觉量化框架的羽毛增长模式。前面。Bioinform。3:1073918。doi: 10.3389 / fbinf.2023.1073918

收到:2022年10月19日;接受:2023年1月25日;
发表:2023年2月3日。

编辑:

Marc Thilo Figge、莱布尼茨天然产品研究所和感染生物学、德国

审核:

丹尼尔·鲍姆德国柏林,Zuse研究所
陈Siang Ng台湾国立清华大学,
兰德尔Widelitz美国南加州大学

版权©2023汤普森,维克里,夏皮罗和许。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

*通信:泰勒n .汤普森Tyler.N.Thompson@Utah.edu

下载