处理多份vcf时,报GATK GenotypeConcordance:Sequence dictionaries are not the same size
解决方案:统一header中的##contig=<ID= 部分
注:
1)脚本如下
gatk --java-options -Xmx3G GenotypeConcordance \
--CALL_VCF $testvcf \
--OUTPUT ${sample}_zbolt_microarray \
--IGNORE_FILTER_STATUS \
--TRUTH_VCF $baseline \
--TRUTH_SAMPLE $sample && echo "${sample} done"
2)GATK GenotypeConcordance 相比 GATK Concordance的区别
GenotypeConcordance 在样本的genotype 水平统计,即FORMAT filed,统计GT,AD,AF等值 。
Concordance 在样本的site水平统计,即INFO field或REF/ALT fileds
当然比较两个vcf的以上filed,都是在overlap sites统计