作者= (Pham Diem-Trang Phan Vinhthuy TITLE =代表细菌具有独特的基因签名=前沿》杂志上大数据量= 5年= 2022 URL = https://www.frontiersi雷竞技rebatn.org/articles/10.3389/fdata.2022.1018356 DOI = 10.3389 /抽象fdata.2022.1018356 ISSN = 2624 - 909 x =分类或识别细菌宏基因组样本在宏基因组数据的分析是一个重要的问题。这个任务可以计算昂贵,因为微生物群落通常包含成百上千的环境微生物物种。我们提出了一种新的方法用于表示细菌微生物群落利用基因组特征的细菌。对微生物群落,每个细菌的基因签名是独一无二的,细菌;他们不存在于社区的其他细菌。进一步,因为细菌的基因组特征远小于其基因组大小,该方法允许微生物群落的压缩表示。这种方法使用一个修改布隆过滤器存储短k-mers每个细菌都有其独特的散列值。我们表明,大多数细菌在许多微生物可以表示独特的使用提出了基因签名。这种方法铺平了道路向新方法分类细菌宏基因组样本。