嵌合体序列指在pcr过程中,两条不同的序列产生杂交扩增的序列,属于人工污染,在ITS和16S分析中,应该首先去除,USearch提供去除嵌合体的功能
usearch -uchime_ref reads.fna -db reference.fna -strand plus -nonchimeras nonchimeras.fna
usearch 链接:http://drive5.com/usearch/manual/uparse_cmds.html
同时usearch提供更加可靠的聚类方案(未详考),聚类流程:
1 usearch -derep_fulllength nonchimeras.fna -output derep.fa -sizeout
计算reads丰度(完全一样的reads数量)
2 usearch -sortbysize derep.fa -output sorted.fa -minsize 2
按照reads丰度排序,并且去除丰度为1的reads
3 usearch -cluster_otus sorted.fa -otus otus1.fa
聚类
4 python fasta_number.py otus1.fa OTU_ > otus.fa
OTU命名
5 usearch -usearch_global nochimeras.fa -db otus.fa -strand plus -id 0.97 -uc map.uc
制作uc文件
6 根据uc文件制作 otu.table