细菌完成图组装软件简单介绍
细菌基因组简单组装
最近看了两篇三代测序数据用于细菌完成图组装的软件,一个是AHA,一个是HGAP。这两个软件中AHA是采用的混合拼接的方法,HGAP则是完全利用的唇三代数据。
AHA 的文章
A Hybrid Approach for the Automated Finishing of Bacterial Genomes(12年)
文章主要的对海地霍乱菌株,利用已有的contig序列,通过三代长片段,组装得到了近完成图,最终的准确性大概有99.9%。
因为二代测序小片段组装难以解决细菌中的三个区域,因此利用三代能得到好的效果,有助于后续的分析。
这其中三部分复杂区域主要是:rRNA 操纵子重复区域,前噬菌体区域,superintegron 区域。
文章还说明了完成图对于细菌基因组分析的重要型,其中最重要的一点就是曾经通过多位点和表型分型会容易忽略一些潜在的变异,而利用完成图则不会。
知识延伸
Typing分型技术
常用的细菌分型技术包括:脉冲场电泳法、随机引物PCR法、扩增片段长度多态性、多位点分型、质粒图谱分析,核糖体分型等。意义在于:流行病检测、致病机制和耐药机制研究、检测抗生素活性研究等。
HGAP软件
Nonhybrid, finished microbial genome assemblies from long-read SMRT sequencing data
HGAP软件相对与混合拼接软件来说,优点在于不需要大量的准确性的read片段来进行纠错,本身可以自身进行纠错。原理大概如下:首先利用长read做为种子序列来收集其他的reads来构建精度较高的preassembled reads ,然后再进行组装。
对E.coli 进行拼接过程和效果如下:
其他物种组装效果
和其他混合拼接结果相比
- 发表于 2017-04-01 16:45