基因组调查和遗传特性的金合欢pachyceraso·施瓦兹
- 1环境与生命科学研究中心、科威特科学研究所,科威特,科威特
- 2逻辑生命科学、免疫学、印度浦那
金合欢pachyceraso·施瓦茨(Leguminoseae)木本树生长在科威特已经濒临灭绝。高通量基因组研究是立即对其康复需要制定有效的保护策略。因此,我们进行了基因组物种的调查分析。全基因组测序产生~ 97 Gb的原始读取(92 x报道)质量分数高于Q30 /基地。k-mer分析(mer) 17日透露其基因组大小720 mb平均guanine-cytosine (GC)的比例35%。组装基因组重复区域分析(45.4%点缀的重复;-retroelements 9%;2%的dna转座子)。车身的基因组的完整性评估确认组装完成的93%。基因比对BRAKER2 34374记录对应33650个基因。 Average length of coding sequences and protein sequences were recorded as 1,027nts and 342aa, respectively. GMATA software filtered a total of 901,755 simple sequence repeats (SSRs) regions against which 11,181 unique primers were designed. A subset of 110 SSR primers were PCR validated and demonstrated for its application in genetic diversity analysis of金合欢。SSR引物成功放大答:gerrardii幼苗DNA描述跨物种间可转让性。主坐标分析和分割分解树(引导运行1000复制)的分布金合欢基因型为两个集群。流式细胞术分析揭示了答:pachyceras基因组是多倍体(6 x)。DNA内容被预测为2.46 pg, 1.23 pg,和0.41 pg对应2 c DNA,分别1 c DNA和cx DNA。结果提供一个基地进一步高通量基因组研究和分子育种的保护。
介绍
植物多样性的损失由于栖息地的丧失,碎片,和退化,过度开采、污染和人为气候变化是向全世界关注(Corlett 2016)。严酷的气候条件进一步加强在旱地包括阿拉伯半岛的影响(艾尔Salameen et Al ., 2018;et al ., 2019;艾尔Salameen et Al ., 2020;哈比比et al ., 2020;哈比比et al ., 2022 a)。科威特提供了有价值的基因池的原生植物包括盐相关基因和抗压力,然而退化的植物多样性面临严重的后果(奥马尔et al ., 2001;2010年亚欧会议和罗伊;Al Salameen et Al ., 2018 b;艾尔Salameen et Al ., 2020;艾尔Salameen et Al ., 2022)。已开始在科威特努力恢复其原生植被,这个国家是一个生物多样性公约(CBD)的签署,因此这是一个授权的基因特征有效的减少物种保护管理(CBD, 1992)。
关键的第一步在保护和管理濒危物种调查他们的生态和进化特征(Al Salameen et Al ., 2018 b;哈比比,2019;哈比比et al ., 2020)。基因组工具已经成为一个有用的工具在各方面的保护遗传学(伯恩,2018年)。下一代测序(上天)是一个功能强大的方法,回答了进化生物学的基本问题,然而其应用在更广泛的范围内还阻碍了由于高成本的全基因组测序和大量计算资源的需求。此外,non-model物种的基因组资源稀缺限制了其实现各种各样的植物物种(Fuentes-Pardo Ruzzante, 2017)。捷基于基因组调查或测序深度较低是一个必要的和具有成本效益的方法获得所需的生物体的遗传信息没有先验知识的序列(Kirkness et al ., 2003)。初步的基因组特征通过这种方法有助于产生一种特异的资源以及元素比较基因组分析(Straub et al ., 2012)。基线信息获得的基因组浏览设置大规模的基础,高通量测序,物种识别、杂交、亲缘关系和进化历史分析(Fuentes-Pardo Ruzzante, 2017)。
金合欢pachyceras施瓦兹(豆科)是一种产于科威特的特有种。只有一个幸存的标本在该地区(苏莱曼,2017)。沙漠居民,高度强调宽容与固氮的能力是一个非常理想的候选人沙漠康复(内维尔et al ., 2013;苏莱曼,2017;贵港市et al ., 2018;工,et al ., 2020)。除了这一物种已报告熊药用价值(El-Wahab et al ., 2008)。在科威特,它被指定为“威胁”附近由世界保护监测中心(奥德菲尔德et al ., 1998)。因此,至关重要的是重要的树种(制定保护策略哈比比et al ., 2020)。努力为其恢复启动(内维尔et al ., 2013;苏莱曼,2017;苏莱曼et al ., 2018;苏莱曼et al ., 2019),然而基因组信息是完全缺乏。因此我们进行了基因组调查分析来预测其基因组大小、执行基因注释和筛选基因组中重复序列。引物侧翼简单重复序列(SSR)图案也设计和验证进行遗传多样性分析。
材料和方法
抽样和DNA隔离
目前调查,年轻的叶样本只有坚持成熟树标本金合欢pachyceras保护在沙巴(SANR)科威特(Al自然保护区图12020年1月期间收集的。三到四个豆荚从这棵树也聚集,他们的胚胎切除和发芽KISR实验室,其中只有一人生还。年轻的叶子剪掉这一岁的幼苗的DNA分离。叶片形态不同的样本金合欢基因型生长在接近附近的母亲树(西北,n = 5;东部和北部,n = 5) SANR也收集进行遗传多样性分析。大约2 - 3个月大的幼苗金合欢gerrardii(苏莱曼,2017;苏莱曼et al ., 2018)(n = 5)增长的温室下科威特科学研究所(KISR)也采样与现场登记入册。所有样本的GPS坐标记录(表S1)。总共17样本收集和DNA孤立于叶样品按照CTAB协议其他地方描述(哈比比et al ., 2022 b)。通过光谱光度测量的DNA质量、纯度和数量估计(Nanodrop UV / Vis分光光度计,ThermoFisher)和荧光(量子位,表达载体,WA)方法根据制造商的指示。
图1科威特的地图(一)金合欢树的位置显示在沙巴Al-Nature储备和KISR温室。使用ArcGIS v10.4.1地图了。(B)一个成熟的树金合欢pachyceras生长在沙巴Al-Nature储备地区的科威特。
倍性通过流式细胞术和基因组大小
植物组织的标准黍miliaceum(2 n = 4 x = 36;2 c = 2.09 pg DNA) (Kubešova et al ., 2010)答:pachyceras,答:gerrardii被切成小块介于0.3到1.0毫米到培养皿中充满的混合OttoI (0.1 M柠檬酸+ 0.50% Tween20)和OttoII (0.40 Na吗2HPO4.12H2O) (1:1)。整个混合物过滤42-μm尼龙网和离心机在5000 rpm,孵化在40°C。颗粒收集和resuspended OttoI。悬浊液受到RNA降解利用核糖核酸酶(西格玛奥德里奇)30分钟。核DNA染色通过添加75µl propidium碘(西格玛奥德里奇)。Flowcytometry分析染色细胞核进行基于3激光流式细胞分析仪MACSquant10分析仪(Miltenyi生物技术GMBH)。总共有100000个事件记录为每个样本和花期测定B2通道和平均荧光强度测量。最终的数据规范化和分析FlowJo™v10.8软件(BD生命科学)。绝对的DNA样本数量的计算主要基于平均峰值的方法定义为(Doležel Bartoš,2005)。
基因组测序和K-mer分析
成熟的树的DNA样本答:pachyceras冻干,运到北京基因组研究所(BGI),香港paired-end测序。岗位质量检查在BGI, DNA tagmented和受到图书馆准备。DNA片段被修复,3跟踪与结扎与Illumina公司适配器(汗et al ., 2016)。此后,图书馆是净化通过Agencourt AMPure XP磁珠(美国贝克曼库尔特基因组学、沥青、CA) (哈比比et al ., 2021)。测序进行2500年Illumina公司HiSeq (Illumina公司,圣地亚哥,美国)平台使用2 x 250化学循环。质量参数的原始数据通过FASTQC版本0.119 (2010年安德鲁斯)。原始读取削减使用Trimmomatic v . 0.17 (博尔格et al ., 2014)。过滤后的高质量的序列最初由Platanus-allee 2.0 (Kajitani et al ., 2019)。水母2.1.4被用来进行K-mer分析(Marcais和沉重,2011)。基因组大小的估计是基于k-mer频率分布和17-mer的数量。
新创装配和基因注释
基因注释用于优质paired-end DNA测序数据新创组装的金合欢pachyceras使用MaSuRCA-4.0.3基因组(Zimin扎尔茨贝格,2022)。主要总成是过滤去除支架短于500个基点。一个新创对过滤重复库组装构建使用RepeatModeler2.0.3 (弗林et al ., 2020),包括侦察(包和艾迪,2002年),RepeatScout (价格et al ., 2005)和串联重复序列仪(本森,1999)。重复图书馆当时受到RepeatMasker 4.1.3查找和面具组装基因组中的重复使用rmblast作为默认搜索引擎(Smit Hubley, 2008)。BRAKER2管道是用于执行基因预测通过集成从头开始基因预测,基于植物蛋白序列,结合GeneMark-EP和奥古斯都3.2.0 (Brůna et al ., 2021)。不同物种的植物蛋白质序列用于基因预测从OrthoDB v10数据库下载。蛋白质的ProtHint 2.5.0映射管道被用于植物蛋白序列的生成需要提示制动器(霍夫et al ., 2018)。蛋白质序列的组装支架和生成提示被用于获取初始基因结构使用GeneMark-ET工具。最初的基因结构被用于训练,奥古斯都生成最终的基因预测。预测基因筛选保留那些完全支持提示。基因组序列的GC含量估计(维奇et al ., 2013)。车身v3.0.2(基准统一单副本直接同源)工具是用来评估基因组的完整性(西芒et al ., 2015)。
鉴定的微卫星图案和遗传多样性分析
GMATA 2.0工具被用来过滤基因组微卫星地区(王先生和王出版社,2016年)。di -的数量的识别条件,三、四、五和hexa-nucleotides重复被设置为5个以上。内置底漆3 (3.0 v) GMATA被用来设计引物对过滤SSR主题(Untergasser et al ., 2012)。引物设计的参数设置是18 ~ 23日英国石油公司引物大小、退火温度57 - 62°C, GC含量30 - 70%,100 ~ 400年英国石油公司最终产品的长度。110是随机选择和合成的引物PCR扩增(热费希尔科学、沃尔瑟姆,妈,美国)。所有的引物都溶解在核酸酶游离水和调整到1μM证券工作。17日进行了PCR基因型的金合欢。反应体积的20μL组装在200年μL PCR板由10 ng的DNA, 1×PCR反应混合液(索利斯生物因素、塔尔图、爱沙尼亚)和0.3μM正向和反向引物。热循环中执行Veriti热循环(应用生物系统公司、大岛,纽约)最初的DNA聚合酶灭活95°C 12分钟,紧随其后的是30个周期为30秒95°C的变性,退火55°C 30年代和72°C扩展在50秒(穆斯塔法et al ., 2017)。PCR产品可视化在2.0%琼脂糖凝胶为60分钟10 V /厘米。在凝胶凝胶可视化文档系统(美国BioRad Chemidoc MP)在紫外线下。所有的样品放大和生产清晰、可再生的乐队产生了186位点,得分作为礼物(1)或(0)缺席。一个二进制矩阵(1/0)生成和分析通过GenAlEx 6.5软件(Peakall Smouse, 2006)。人口结构是由neighbor-net分裂分解网络所产生的分裂树5.0和引导经营1000复制(Kloepper Huson, 2008)和主坐标分析(PCoA)。
结果
这手稿提出了基因组序列数据的珍稀濒危树种生长在科威特。原始序列被用来估计基因组大小、重复内容,基因数量,GC %内容和微卫星引物DNA内的分布金合欢pachyceras。引物设计对SSR区域被用于遗传多样性分析。流仪分析进行倍性鉴定和2 c基因组大小的预测。
过滤和k-mer序列分析
两个300 - 400个基点(插入大小)paired-end图书馆产生了108 GB,原始读取。每基质量分数介于34.0 - -37.0之间(平均= 36.0)。大约有10%的低质量的数据过滤,剩下的96 GB (ca。89%)用于下游分析。其中,645 Mb合格进行进一步分析。K-mer基因组大小的分析提供了一个估计基于子字符串的长度k包含在生物序列。除此之外,这也表明低质量或污染的序列。17-mer频率分析确定主要的峰值在120 X深度基于k-mer数量的86462013672 (图2)。在k-mer数量除以120基因组大小被预测为~ 720 Mb(720516781个基点)。另一个峰值在主峰½(50 x)最有可能由于高水平的杂合性(6.84%),而另一个峰值在类似的深度(25 x)是因为重复率在多个整数的位置(56.89%)。
图2K-mer分析基因组大小的预测金合欢pachyceras。轴表示深度和对应的频率上绘制轴。k-mer右边面板显示的值分析参数和基因组的大小(k-mer号码/峰深度)。山峰在25 x和50 x是由于重复和杂合的基因序列。
新创装配和基因预测
总共有6.4亿paired-end读取被用来构造一个原始基因组组装的答:pachyceras。169210年的组装基因组由支架(1.19 Gb)。移除支架< 500 Mb了~ 1.043 Gb的过滤装置包含155442支架(图3一)。序列的数量扣除Ns 1042649449个基点。总装包含非常低N含量(~ 0.07%)。最大的支架是120115个基点的将军12073年,3238年N90预示24820年和88523年L90。基因组包含更多的腺苷基地(340306430)其次是胸腺嘧啶(338837198)>胞嘧啶(181783987)和鸟嘌呤(181721834)(图3一)。GC含量预测是34.84%采用一个滑动窗口算法在每10 kb序列。(图3 b)。车身的基因组的完整性评估显示93.2%的组装完成(C: 2168)。有1127(48.5%)完成,重复的车身(D), 1041(44.8%)完成车身和单副本(S),和一个仅仅97(4.2%)的分散的车身(F),持续8秒,总计造成2368车身被搜查了其中只有2.5%(67)错过了(M) (图3 c)。更多的C F和M车身相比是一个高质量的基因组组装的暗示。
图3新创组装的金合欢pachyceras。(一)组装统计。使用MaSuRCA-4.0.3基因组组装。(B)GC的内容金合欢pachyceras基因组。轴表示GC %和测序深度上绘制轴。滑动窗口在10 kb重叠基地用于GC %估计。(C)车身的完整性评估基因组组装。车身是在基因组模式下运行使用metaeuk作为基因预测。x轴介绍了车身%和y轴表示基因组的名字。
重复序列,基因预测和注释
一般重复DNA通常协助表达典型的编码序列和重要的组织功能基因组复制和发展所需的以下一代的细胞。因此,我们在组装基因组中重复序列特征,发现其总长度~ 488.3 Mb,占~ 46.8%的选秀大会。其中,~ 34%的重复是不保密的。DNA转座子与~ 2%,而retroelements ~ 9%的基因组。重复的完整列表以及基因组草案中的内容所示表1。总点缀重复是45.42%。
使用BRAKER2管道基于基因预测从头开始方法,直接同源蛋白质序列,导致127367年共有123610个基因对应记录。然而,这些包括支持和不支持的记录。完全支持的文本提示是最自信的预测。因此,我们使用一个脚本,selectSupportedSubsets.py”BRAKER2提供的管道中提取的最自信的预测记录的完整列表。这导致34374记录对应33650个基因。这些记录被认为是进行进一步分析。最自信的转录和蛋白质序列的统计所示表2。编码序列的平均长度为1027元(Max 11262元;min - 201元),而蛋白质序列342 aa (max - 3754 aa;分钟- 67 aa)。
SSR采矿、引物设计和遗传多样性分析
矿业的组装基因组微卫星在GMATA图案产生了901755个SSR图案。其中,二核苷酸是最大的号码(796441;88%),其次是三核苷酸(90769;10.06%),tetranucleotides (12435;1.3%),pentanucleotides (1651;0.18%),hexanucleotides (418;0.05%)(图4一)。总共11596对引物的设计与这些SSR图案和11181其中有独特的(图4 b)。基因组中大约98.71%的SSR主题定位不符合标准的引物设计参数,因此没有引物可以为他们设计的。基于GBS的SNP标记建议追究来克服这个限制。
110对引物的一个子集代表每个重复类随机选择了PCR验证(表S2)。放大了186个基因位点下游分析。中,这141个(75.65%)多态(图片= 0.27)。这些位点在GenAlEx进口v6.5软件估计成对遗传距离,分子方差分析(AMOVA)和主坐标分析。PCoA分析揭示了金合欢登记入册分成三个集群。变化1圣2nd和3理查德·道金斯轴分别为24.26%、38.54%和49.06%,分别。PCoA分布式的金合欢基因型为小型和大型集群(图5一个)。小集群只有两个基因型AP01(单样本答:pachyceras生长在SANR)和AP12(母亲树的幼苗)。其他所有的基因型组成了一个较大的集群的一部分。UNK-NE, UNK-NW AG-S存在三大集群重叠的类。基因型AP-17 UNK-NW后到达而AP3, AP4, AP11 AP16形成一个单独的组。基于UNK-NW分组和UNK-NE与AG-S到达大集群我们假设这些形态不同的基因型单一标本附近的增长答:pachycerasSANR地区答:gerrardii。两两之间的遗传距离(D Nie)基因型范围从6 (AP09-AP10)到77 (AP07-AP12) (表S3)。我们建造了一个分裂分解树遗传距离和观察AP01 AP12密切相关。其他基因型的分组与PCoA在协议分析(图5 b)。
图5(一)主坐标分析(PCoA)情节的成对基因17基因型之间的距离答:pachyceras基于189个多态性SSR位点。(B)分裂分解网络十七金合欢树的基因型。分裂树v5算法用于构造树999排列和引导。
分子方差分析(AMOVA)分区种群内遗传多样性为75%而在人口多样性是25% PhiPT (r)等于0.249 (p < 0.001)。17日总计999排列事件进行样品和189位点。两两种群内遗传距离是47 (AP-MT), 34.2 (UNK-NW), 25.4 (UNK-NE)和30 (AG-S)。
流式细胞仪DNA含量和倍性
的基因组大小答:pachyceras也估计通过流式细胞术和参考标准p . milaceum(表3)。2 c的含量答:pachyceras2.46 pg DNA计算1 c值为1.23 pg DNA。holoploid基因组大小估计为1204.9 Mb运用1倍相当于978 megabases pg的DNA。比标准的2 n的高峰,答:pachyceras显示三种不同的山峰暗示多倍体的标本收集。第一个峰值或G1峰是二倍体峰,而第二和第三峰很可能由于四倍性和六倍性。主要峰的平均荧光强度(MFI) (G1峰)值为7.38时略高于参考峰(6.26)而二级和三级顶峰答:pachyceras展出MFI相当于13.20(1.7倍),24(3.2倍)分别为(图6 a, B)。峰高度的差异是由于不同细胞表现出不同倍性水平在同一植物组织。基于DNA倍性水平分析1残雪pg(单倍体DNA内容)估计为0.41 pg暗示单倍体基因组的大小答:pachyceras400.98 Mbp。倍性和基因组的大小答:gerrardii也通过流式细胞术分析。2 c, c和1残雪在与价值观答:pachyceras(图6 c, D)。这个物种还拥有六倍体的基因组答:pachyceras。
图6(一)流仪直方图基因组大小估计和倍性的评估答:pachyceras。粉色峰值对应答:pachycerasnuclie而蓝色的峰值代表了标准黍miliaceum(2 c = 2.09 pg;2 n = 4 x = 36)。细胞核的参考样本提取物种和沾propidium同时碘和分析。相对荧光是绘制在轴和轴上的核数显示。(B)酒吧的最低的荧光强度答:pachyceras和P.miliaceum细胞核。(C)流仪直方图基因组大小估计和倍性的评估答:gerrardii。(D)酒吧的最低的荧光强度答:gerrardii和p . miliaceum细胞核。
讨论
全基因组测序在几个树种辅助理解进化的历史,稀有和濒危物种的种群遗传学,分子分类、碎片、花粉传播的作用,恢复管理和适应气候变化伯恩,2018年;Onley et al ., 2021)。只有少数报告可以在这些方面的保护管理金合欢。传统基因组分析依赖于相对少量的脱氧核糖核酸(DNA)温和的纯洁,另一方面,门店技术需要输入几微克的高分子量DNA的纯度范围在1.8 - -2.0之间,自由从多糖和多酚(希利et al ., 2014)。几个种类的金合欢木本树,这些污染物积累大量限制其基因组的研究(杜立石et al ., 1999;伯恩et al ., 2001;Kumar et al ., 2018;Maximo et al ., 2020)。在我们之前,报告中,我们提出了一个优化的协议得到理想的DNA的高通量测序质量和数量金合欢(哈比比et al ., 2022 b)。目前的手稿描述了我们之前研究的适用性。
基因组测序提供了初步调查了解一个物种的基因组特征没有先验知识可以执行前大规模测序。与类似的目标,高质量的图书馆(phr得分> 30)答:pachyceras构建并执行全基因组测序深度92 x。的基因组大小答:pachyceras被预测为720 mb,完全比得上吗答:acuminata(750 mb)答:melanoxylon(750 mb) (弗格森et al ., 2021)。相反它是高于的基因组Vachellia collinsii(462 mb) (Leichty Poethig, 2019)。k-mer方法已经用于预测non-model物种的基因组大小(刘et al ., 2013;陆et al ., 2016),因此,在目前的研究工作。至今只有两个金合欢物种从澳大利亚已经测序在全基因组水平的报道~ 50 x在牛津纳米孔的奴才定序器(弗格森et al ., 2021)。在一个类似的报道诉collinsii测序的Illumina公司HiSeq (Leichty Poethig, 2019)。我们的研究结果提供了一个宝贵的资源在其他种类的高通量测序研究金合欢。叶绿体基因组的一个ligulata被预测为0.158 mb的吗答:crassicarpa0.176 Mb (威廉姆斯et al ., 2015;悦et al ., 2021)。DNA流式细胞术是另一个在细胞核的DNA量估算方法和预测一个有机体的基因组大小(Doležel Bartoš,2005)。流式细胞术预期的基因组大小答:pachyceras1.2 gb。k-mer建立和流量仪基因组的差异值记录Aspalathus linearis(Mgwatyu et al ., 2020)浅绿色pentagyna(Al-Qurainy et al ., 2021),浅绿色lutea(Al-Qurainy et al ., 2021)。
GC含量的一个重要特性是一个有机体的基因组。GC内容和因素的识别其基因组中分布百分比帮助阐明一个物种的进化地位。20的GC含量植物物种被辛格和他的团队相比(辛格et al ., 2016)。他们的工作展示了GC含量最高的草单子叶和双子叶植物non-grass紧随其后。GC含量35%金合欢基因组接近杨树trichocarpa(33.71%),番木瓜(34.91%)和葡萄(34.57%)(辛格et al ., 2016)。
植物基因组规模大,杂合的,不同倍性水平,和高度重复让他们组装很麻烦(迈克尔和VanBuren, 2020年)。目前,答:pachyceras基因组组装使用MaSuRCA-4.0.3相结合的好处和Overlap-layout-consensus deBruijn图。此外,水母mer-counter也集成在MaSuRCA。类似的算法被用来组装的基因组诉collinsii(Leichty Poethig, 2019)。与我们的结果Canu v2.0的组装方法被用来组装的基因组答:acuminata和答:melaxnoxylon。然而,后者是专门为高噪音单分子基因组测序PacBio RSII或牛津纳米孔的奴才。在这种情况下是模棱两可的交叉研究比较。我们记录了一个过度重复率≥50%,杂合性组装基因组的6.8%的比例金合欢。我们的未来在测序的方法金合欢基因组在单分子水平和物理映射可能会提供染色体水平装配提供一个更好地了解基因组的复杂性树种在目前的调查。
流式细胞术分析提供信息的DNA含量答:pachyceras。的2 c含量2.46 pg的DNA中观察到当前样本接近获得的值答:塞内加尔生长在信德,巴基斯坦(2.89 - -2.99 pg的DNA)和焦特布尔、印度(3.0 pg的DNA)。然而,另外两个到达焦特布尔、印度显示2 c含量低的1.35和1.51 pg。南非答:塞内加尔2 c内容描述介于1.51到1.61 pg而西非基因型在1.34到2.90 pg的范围。相似的价值观都记录了中部和东部非洲人口(Odee et al ., 2015)。其他物种的豆科的2 c内容家庭4.42 pg DNA (Galega oficinalis),1.60 pg DNA (Lupinus polyphyllus),3.49 pg DNA (紫花苜蓿),1.09 pg DNA (三叶草hybridum),6.23 pg DNA (野豌豆属开大花的)(Kubešova et al ., 2010)。所有这些物种表现出不同倍性水平。存在多个山峰k-mer频率的情节答:pachyceras是暗示的多倍体物种。流动仪的推论也解释了六倍性的可能性的唯一幸存的标本答:pachyceras。二倍体、三倍体、四倍体、六倍体和八倍体的基因组被观察到答:塞内加尔收集来自撒哈拉以南非洲、巴基斯坦、印度和澳大利亚的相思,答:dealbata(Odee et al ., 2015)。Karyological调查才能得到确认的倍性鉴定结论伍迪的树种答:pachyceras。
SSRs,也被称为微卫星,是最有益的和通用的遗传标记用于植物功能基因组学。然而,识别SSRs使用传统技术及其发展是艰巨的,昂贵和费时的(塔et al ., 2018;Mathur et al ., 2013;哈比比et al ., 2020)。高通量测序技术最近使研究人员在一个较小的成本识别成千上万的微卫星用最小的努力的几分钟相比传统的爆炸搜索(哈比比et al ., 2022 a,c,Šarhanova et al ., 2018;塔et al ., 2018)。我们证明了基因组测序过滤的效用超过900000个SSR图案。总共有11181标记成功设计对这些地区,其中一百放大合理的186个基因位点遗传多样性分析(艾尔Salameen et Al ., 2022;艾尔Salameen et Al ., 2020;艾尔Salameen et Al ., 2018 a;艾尔Salameen et Al ., 2018)。我们的遗传多样性分析的前瞻性研究铺平了道路保护珍稀濒危的管理答:pachyceras。SSR标记是共显性和展览交叉可转移性,因此可以适用于其他物种的分子研究金合欢。这一特性也在我们的调查,作为标记成功放大密切相关的基因位点答:gerrardii(苏莱曼,2017;苏莱曼et al ., 2018)。基因组测序协助夏威夷高雅的森林管理和修复(金合欢高雅)(贵港市et al ., 2018)。
数据可用性声明
提出了原始的贡献研究公开。这些数据可以在这里找到:NCBI PRJNA754103。
作者的贡献
NH:范本初稿准备,审查和编辑。FZ, NR, NV先生:方法。NH和NV:软件、数据管理。尼克-海德菲尔德:可视化。NH和FS:验证。NV VK:正式的分析。VK:调查。FS:资源。FS:项目管理。NH和FS:融资收购。 All authors contributed to the article and approved the submitted version.
资金
我们感谢科威特科学发展基金会(KFAS批准号PR18-12SL-12)和科威特科学研究所(KISR批准号FB134C)来资助这项研究。
确认
我们将贾马尔Dashti先生感谢他的帮助在样本收集。
的利益冲突
作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。
出版商的注意
本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。
补充材料
本文的补充材料在网上可以找到:https://www.雷竞技rebatfrontiersin.org/articles/10.3389/fpls.2023.1062401/full补充材料
引用
Al-Qurainy F。,Gaafar, A.-R. Z., Khan, S., Nadeem, M., Alshameri, A. M., Tarroum, M., et al. (2021). Estimation of genome size in the endemic species浅绿色pentagyna和本地稀有物种浅绿色lutea使用流式细胞仪和K-mer方法的比较分析。植物10日,1362年。doi: 10.3390 / plants10071362
Al Salameen F。哈比比,N。,一个l Amad, S., Al Doaij, B. (2022). Genetic diversity ofRhanterium eppaposum摘要采用。人口在科威特的GBS透露的。植物11日,1435年。doi: 10.3390 / plants11111435
Al Salameen F。哈比比,N。,一个l Amad, S., Kumar, V., Dashti, J., Talebi, L., et al. (2020). Genetic diversity analysis ofRhanterium eppaposum摘要采用。由ISSRs揭示弱势人口结构。咕咕叫。植物医学杂志。21日,100138年。doi: 10.1016 / j.cpb.2020.100138
Al Salameen F。哈比比,N。库马尔,V。,一个l Amad, S., Dashti, J., Talebi, L., et al. (2018). Genetic diversity and population structure ofHaloxylon salicornicumMoq。在科威特,ISSR标记。《公共科学图书馆•综合》13日,e0207369。doi: 10.1371 / journal.pone.0207369
亚欧会议,s . O。,Roy, W. Y. (2010). Biodiversity and climate change in Kuwait.Int。j .气候变化策略管理。2,68 - 83。doi: 10.1108 / 17568691011020265
布莱思C。,Christmas, M. J., Bickerton, D. C., Faast, R., Packer, J. G., Lowe, A. J., et al. (2020). Increased genetic diversity通过基因流提供了希望金合欢whibleyana,濒危板条面临灭绝。多样性。12日,299年。doi: 10.3390 / d12080299
博尔格、a . M。Lohse, M。,Usadel, B. (2014). Trimmomatic: A flexible trimmer for illumina sequence data.生物信息学点,2114 - 2120。doi: 10.1093 /生物信息学/ btu170
Brůna, T。,霍夫,k . J。,Lomsadze, A., Stanke, M., Borodovsky, M. (2021). BRAKER2: automatic eukaryotic genome annotation with GeneMark-EP+ and AUGUSTUS supported by a protein database.NAR基因组Bioinf。3,lqaa108。doi: 10.1093 / nargab / lqaa108
伯恩,M。,Macdonald, B., Francki, M. (2001). Incorporation of sodium sulfite into extraction protocol minimizes degradation of Acacia DNA.生物学技术742 - 748年。doi: 10.2144 / 01304 bm06
CBD (1992)。生物多样性公约。联合国条约爵士。1760年,1 - 30619。可以在:https://www.cbd.int/doc/legal/cbd-en.pdf。
Doležel, J。,Bartoš, J. (2005). Plant DNA flow cytometry and estimation of nuclear genome size.安。机器人。95年,99 - 110。doi: 10.1093 / aob / mci005
du Plessis)。,Nel M。,Buys, M. (1999). Optimised DNA isolation from金合欢台地高原(蝶形花科)。南误判率。j .机器人。主板市场,437年。doi: 10.1016 / s0254 - 6299 (15) 31037 - 1
El-Wahab, R。,Zaghloul, M. S., Kamel, W. M., Moustafa, A. R. A. (2008). Diversity and distribution of medicinal plants in north Sinai, Egypt.误判率。j .包围。科学。抛光工艺。2,157 - 171。doi: 10.5897 / AJEST.9000035
Al Salameen a S。哈比比,N。库马尔,V。,一个l Amad, S., Talebi, L., Al Doaij, B., et al. (2018a).的遗传特征Haloxylon salicornicum和Rhanterium eppaposum本地植物DNA标记的科威特(科威特)最终报告项目FB089C,科威特科学研究所。
弗格森。琼斯,。,Borevitz, J. (2021). “金合欢acuminata&Melanoxylon,“在美国国家生物技术信息中心:研究学院的生物学(澳大利亚国立大学)。金合欢acuminata - PRJNA510265金合欢melanoxylon PRJNA510265
弗林,j . M。Hubley, R。,Goubert, C., Rosen, J., Clark, A. G., Feschotte, C., et al. (2020). RepeatModeler2 for automated genomic discovery of transposable element families.Proc。国家的。学会科学。117年,9451 - 9457。doi: 10.1073 / pnas.1921046117
Fuentes-Pardo, a P。,Ruzzante, D. E. (2017). Whole-genome sequencing approaches for conservation biology: Advantages, limitations and practical recommendations.摩尔。生态。26日,5369 - 5406。doi: 10.1111 / mec.14264
贵港市,p F。,Liang, C. T., Sork, V. L., Hodgskiss, P., Wright, J. W. (2018). Applying landscape genomic tools to forest management and restoration of Hawaiian koa (金合欢高雅在变化的环境中)。进化的应用程序。11日,231 - 242。doi: 10.1111 / eva.12534
展开磋商,。,Saveliev, V., Vyahhi, N., Tesler, G. (2013). QUAST: quality assessment tool for genome assemblies.生物信息学29,1072 - 1075。doi: 10.1093 /生物信息学/ btt086
哈比比,n (2019)。植物遗传资源保护DNA标记技术在科威特:学报的第13次国际会议上发展旱地转换旱地地区从灰色变成绿色,11 - 14 2019年2月,焦特布尔、印度。doi: 10.6084 / m9.figshare.14673867.v1。
哈比比,N。,Al Salameen F。拉赫曼,M。库马尔,V。,一个l Amad, S., Shajan, A., et al. (2022c). Draft genome sequence and SSR mining data of Acacia pachyceras Schwartz.简单的数据。42岁,108031年。doi: 10.1016 / j.dib.2022.108031。
哈比比,N。,穆斯塔法,a S。,汗,m . W。(2021). Composition of nasal bacterial community and its seasonal variation in health care workers stationed in a clinical research laboratory.《公共科学图书馆•综合》16日,e0260314。doi: 10.1371 / journal.pone.0260314
哈比比,N。,Al Salameen F。拉赫曼,m . H。艾尔哈桑,S。Bhat, N。,Kumar, V. (2022b).乘法和分子特性的金合欢pachyceras -(现场)原生树在科威特(科威特,科威特科学研究所)。
哈比比,N。,Al Salameen F。拉赫曼,M。Shajan,。贾基尔F。,一个bdulrazzack, N. (2022a). Comparison and optimization of DNA isolation protocols for high throughput genomic studies of金合欢pachyceras施瓦兹。MethodsX2、101799。doi: 10.1016 / j.mex.2022.101799
哈比比,N。,Rahman, M. H., Al Salameen, F. (2020). Synoptic overview on application of molecular genetic markers in Acacia.生物科技研究j . >》。15日,152 - 166。doi: 10.6084 / m9.figshare.14169872.v2
希利,一个。,Furtado, A., Cooper, T., Henry, R. J. (2014). Protocol: a simple method for extracting next-generation sequencing quality genomic DNA from recalcitrant plant species.工厂方法10日,21岁。doi: 10.1186 / 1746-4811-10-21
霍夫,k . J。,Lomsadze, A., Stanke, M., Borodovsky, M. (2018). “BRAKER2: incorporating protein homology information into gene prediction with GeneMark-EP and AUGUSTUS,” in植物和动物基因组第二十六章。
Kajitani, R。,Yoshimura, D., Okuno, M., Minakuchi, Y., Kagoshima, H., Fujiyama, A., et al. (2019). Platanus-allee is a新创单体型汇编程序实现一个全面的访问不同的杂合的地区。Commun Nat。1 - 15。doi: 10.1038 / s41467 - 019 - 09575 - 2
汗,m . W。,哈比比,N。,Shaheed, F., Mustafa, A. S. (2016). Draft genome sequences of five clinical strains of布鲁氏菌melitensis隔离病人住在科威特。基因组的公告。4,e01144-e01116。doi: 10.1128 / genomeA.01144-16
Kirkness, e . F。Bafna, V。,Halpern, A. L., Levy, S., Remington, K., Rusch, D. B., et al. (2003). The dog genome: survey sequencing and comparative analysis.科学301年,1898 - 1903。doi: 10.1126 / science.1086432
Kloepper, t·H。,Huson, D. H. (2008). Drawing explicit phylogenetic networks and their integration into SplitsTree.BMC进化医学杂志。8、1 - 7。doi: 10.1186 / 1471-2148-8-22
Kubešova, M。,Moravcova, L., Suda, J., Jarošík, V., Pyšek, P. (2010). Naturalized plants have smaller genomes than their non-invading relatives: a flow cytometric analysis of the Czech alien flora.Preslia82年,81 - 96。可以在:https://www.researchgate.net/profile/Petr-Pysek/publication/287688630_Naturalized_plants_have_smaller_genomes_than_their_non-invading_relatives_A_flow_cytometric_analysis_of_the_Czech_alien_flora/links/5970cdcc458515fa8de6e39e/Naturalized-plants-have-smaller-genomes-than-their-non-invading-relatives-A-flow-cytometric-analysis-of-the-Czech-alien-flora.pdf。
库马尔,d . A。阿努普,C。,Santan, B., Ajay, T., Mishra, R. J. (2018). DNA Extraction and molecular characterization of金合欢pseudoeburnea——特有种。生物科技研究j . >》。13、8。可以在:https://www.researchgate.net/profile/Ashok-Kumar-79/publication/326877963_DNA_extraction_and_molecular_characterization_of_Acacia_pseudoeburnea_-_An_endemic_species/links/5b7bb7fd299bf1d5a718f138/DNA-extraction-and-molecular-characterization-of-Acacia-pseudoeburnea-An-endemic-species.pdf。
Leichty, a。R。,Poethig, S. (2019). Development and evolution of age-dependent defenses in ant-acacias.Proc。国家的。学会科学。美国的一个。116 (31),15596 - 15601。doi: 10.1073 / pnas.1900644116
刘,B。,Shi, Y., Yuan, J., Hu, X., Zhang, H., Li, N., et al. (2013). Estimation of genomic characteristics by analyzing k-mer frequency in新创基因组项目。arXiv,13082012。doi: 10.48550 / arXiv.1308.2012
陆,M。,一个n, H., Li, L. (2016). Genome survey sequencing for the characterization of the genetic background of罗莎roxburghiitratt和叶片抗坏血酸盐代谢基因。《公共科学图书馆•综合》11日,e0147530。doi: 10.1371 / journal.pone.0147530
Marcais G。,Kingsford, C. (2011). A fast, lock-free approach for efficient parallel counting of occurrences of k-mers.生物信息学27日,764 - 770。doi: 10.1093 /生物信息学/ btr011
Mathur P。,哈比比,N。,Chittora, M., Purohit, S. (2013). Molecular analysis of variability among genotypes ofAbrus precatoriusl .与不同的种皮颜色使用RAPD和ISSR标记。Ind.J。Biotechnol12日,273 - 276。可以在:http://nopr.niscpr.res.in/handle/123456789/19273。
Maximo, Y。,Ikeda, A., Flôres Júnior, P., de Alcantara, G., Higa, A. (2020). Optimization of genomic DNA extraction protocol for black wattle.启农业13日,323 - 329。doi: 10.30612 / agrarian.v13i49.9190
Mgwatyu Y。,Stander, A. A., Ferreira, S., Williams, W., Hesse, U. (2020). Rooibos (Aspalathus linearis)基因组大小估计使用流式细胞仪和k-mer分析。植物9日,270年。doi: 10.3390 / plants9020270
迈克尔,t . P。,VanBuren, R. (2020). Building near-complete plant genomes.咕咕叫。当今。植物医学杂志。54岁,26-33。doi: 10.1016 / j.pbi.2019.12.009
Mosa, k。,Gairola, S., Jamdade, R., El-Keblawy, A., Al Shaer, K. I., Al Harthi, E. K., et al. (2019). The promise of molecular and genomic techniques for biodiversity research and DNA barcoding of the Arabian peninsula flora.前面。植物科学。9日,1929年。doi: 10.3389 / fpls.2018.01929
穆斯塔法,a S。哈比比,N。奥斯曼,。,Shaheed, F., Khan, M. W. (2017). Species identification and molecular typing of human brucella isolates from Kuwait.《公共科学图书馆•综合》12,e0182111。doi: 10.1371 / journal.pone.0182111
内维尔,p·G。,Wallace, M. J., Miller, J. T., Krauss, S. L. (2013). DNA Barcoding for conservation, seed banking and ecological restoration of acacia in the Midwest of Western Australia.摩尔。生态。Resour。13日,1033 - 1042。可以在:https://policycommons.net/artifacts/1372137/the-world-list-of-threatened-trees/1986309/。
Odee, d . W。,Nevill, J., Omondi, S., Perry, A., Cavers, S. (2015). Rangewide ploidy variation and evolution in金合欢塞内加尔:南北分裂?国内工厂7 plv011。doi: 10.1093 / aobpla / plv011
奥马尔,s。Misak, R。,国王,P。,Shahid, S. A., Abo-Rizq, H., Grealish, G., et al. (2001). Mapping the vegetation of Kuwait through reconnaissance soil survey.j .干旱的环境48岁,341 - 355。doi: 10.1006 / jare.2000.0740
Onley, i R。,Moseby, K. E., Austin, J. J. (2021). Genomic approaches for conservation management in Australia under climate change.生活11日,653年。doi: 10.3390 / life11070653
Peakall, R。,Smouse, P. E. (2006). GENALEX 6: genetic analysis in excel. population genetic software for teaching and research.摩尔。生态。笔记6,288 - 295。doi: 10.1111 / j.1471-8286.2005.01155.x
价格,a . L。,Jones, N. C., Pevzner, P. A. (2005).新创在大型基因组重复家庭的识别。生物信息学21日i351-i358。doi: 10.1093 /生物信息学/ bti1018
Šarhanova, P。,Pfanzelt, S., Brandt, R., Himmelbach, A., Blattner, F. R. (2018). SSR-seq: Genotyping of microsatellites using next-generation sequencing reveals higher level of polymorphism as compared to traditional fragment size scoring.生态。另一个星球。8,10817 - 10833。doi: 10.1002 / ece3.4533
西芒,f。,Waterhouse, R. M., Ioannidis, P., Kriventseva, E. V., Zdobnov, E. M. (2015). BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs.生物信息学31日,3210 - 3212。doi: 10.1093 /生物信息学/ btv351
辛格,R。,Ming, R., Yu, Q. (2016). Comparative analysis of GC content variations in plant genomes.太。植物医学杂志。9日,136 - 149。doi: 10.1007 / s12042 - 016 - 9165 - 4
Smit,。,Hubley, R. (2008)2015年RepeatModeler开放- 1.0。可以在:http://www.repeatmasker.org。
Straub, s . C。、公园、M。,Weitemier, K., Fishbein, M., Cronn, R. C., Liston, A. (2012). Navigating the tip of the genomic iceberg: Next-generation sequencing for plant systematics.点。j .机器人。99年,349 - 364。doi: 10.3732 / ajb.1100335
苏莱曼,m (2017)。恢复生态学的金合欢pachyceras科威特国博士论文(西澳大利亚大学),230页。可以在:https://research-epository.uwa.edu.au。
苏莱曼,m K。迪克逊,K。,Commander, L., Nevill, P., Quoreshi, A. M., Bhat, N. R., et al. (2019). Assessment of the diversity of fungal community composition associated withVachellia pachyceras及其根际土壤从科威特沙漠。前面。Microbiol。10日,63年。doi: 10.3389 / fmicb.2019.00063
苏莱曼,M。,Quoreshi, A., Bhat, N., Manuvel, A. (2018). Species identification ofVachellia pachyceras从科威特及其亲属Vachellia gerrardii和Vachellia tortilis基于茎质体基因序列。爱丁堡j .机器人。75年,73 - 90。doi: 10.1017 / S0960428617000385
塔,S。,Lee Abdullah, T., Yusop, M. R., Hanafi, M. M., Sahebi, M., Azizi, P., et al. (2018). Mining and development of novel SSR markers using next generation sequencing (NGS) data in plants.分子23),399年。doi: 10.3390 / molecules23020399
Untergasser,。,Cutcutache, I., Koressaar, T., Ye, J., Faircloth, B. C., Remm, M., et al. (2012). Primer3–new capabilities and interfaces.核酸Res。e115-e115。doi: 10.1093 / nar / gks596
王,X。,Wang, L. (2016). GMATA: an integrated software package for genome-scale SSR mining, marker development and viewing.雷竞技rebat植物科学前沿领域。7日,1350年。doi: 10.3389 / fpls.2016.01350
威廉姆斯,a . V。柏金,l . M。豪厄尔,k。内维尔,p·G。,Small, I. (2015). The complete sequence of the金合欢ligulata叶绿体基因组高度发散clpP1基因。《公共科学图书馆•综合》10,e0125768。doi: 10.1371 / journal.pone.0138367
悦,X。,Yu, Y., Gao, W., Chen, S., Weng, Z., Ye, G. (2021). Complete chloroplast genome sequence of金合欢crassicarpa(蝶形花科)。线粒体DNA B部分。6,2249 - 2250。doi: 10.1080 / 23802359.2021.1944365
关键词:全基因组测序、基因注释,木本树,微卫星,SSR引物,转座因子,流式细胞术
引用:哈比比N, Al Salameen F Vyas以及N,拉赫曼M, Kumar V, Shajan,贾基尔F, Razzack NA和Al Doaij B(2023)基因组调查和遗传特性的金合欢pachyceraso·施瓦兹。前面。植物科学。14:1062401。doi: 10.3389 / fpls.2023.1062401
收到:2022年10月05;接受:2023年1月19日;
发表:2023年2月16日。
编辑:
宝华王南通大学,中国版权©2023哈比比,Al Salameen Vyas以及,拉赫曼Kumar Shajan,贾基尔,Razzack Doaij。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。
*通信:Nazima哈比比,nhabibi@kisr.edu.kw