相较于其他三代四代数据组装软件(Canu(也可用于纠错),smartdenovo,miniasm,Flye,TULIP,FALCON,FALCON-unzip等)
wtdbg有如下优点:
安装运行简单 (可用run_wtdbg_assembly.sh脚本生成运行脚本),运行速度快,
运行内容:一步组装,两轮纠错
“--edge-min”值对基因大小影响特别大,在基因组复杂度低和测序深度大的情况下可提高该值,可降低运行内存和运行时间。(仅进行第一轮组装) [2]
wtdbg2软件使用[2,3]:
提供参数给run_wtdbg_assembly.sh,会动生成运行脚本。
$ ./run_wtdbg_assembly.sh -h
$ cat run.sh
### assembling
wtdbg-1.2.8 -t 0 -i reads.fa.gz --tidy-reads 5000 -fo dbg -k 0 -p 21 -S 4 --rescue-low-cov-edges
进行基因组装 $ wtdbg2 -t 16 -i reads.fa.gz -fo prefix -L 5000
### first round of correction
wtdbg-cns -t 0 -i dbg.ctg.lay -fo dbg.ctg.lay.fa -c 0
得到一致性序列 $ wtpoa-cns -t 16 -i prefix.ctg.lay -fo prefix.ctg.lay.fa
### mapping
kbm-1.2.8 -t 0 -d dbg.ctg.lay.fa -i reads.fa.gz -k 0 -p 21 -S 4 -O 0 | best_kbm_hit.pl | awk '{print $6" "$9" "$10" "$1" "$2"
### generating new layout
map2dbgcns dbg.ctg.lay.fa reads.fa.gz dbg.map >dbg.map.lay
### second round of correction
wtdbg-cns -t 0 -i dbg.map.lay -fo dbg.map.fa -k 13 -c 3
### Finished
其他三代组装软件总结:
https://www.cnblogs.com/djx571/p/10223742.html
参考资料:
[1]https://github.com/ruanjue/wtdbg2
[2] https://www.jianshu.com/p/193f2cdd4407
[3] http://www.chenlianfu.com/?p=2647
[4]https://yiweiniu.github.io/blog/2018/06/Genome-Assembly-Pipeline-wtdbg/ 安装,参数调整等