Flye: 原始 PB / ONT reads 作为输入文件,输出 polished contigs文件
Genome | Data | Asm.Size | NG50 | CPU time | RAM |
---|
Human CHM1 | PB 100x | 2.8 Gb | 18.8 Mb | 2700 h | 676 Gb |
CHM1 was run with --asm-overage 40
Flye使用重复图作为核心数据结构。与de Bruijn图(需要精确的k-mer匹配)不同,重复图的边表示基因组序列,节点定义了连接点。每个边分为独特的或重复的。基因组以未知方式遍历图,因此每个唯一的边在遍历中恰好出现一次。重复图揭示了基因组的重复结构,这有助于重建最佳装配。
参考来源: