• 四种不同的SNP calling算法call低碱基覆盖度测序数据时,SNVs数量的比较(Comparing a few SNP calling algorithms using low-coverage sequencing data)


    摘要:如果不设置任何过滤标准的话,SOAPsnp会call出更多的SNVs;AtlasSNP2算法比较严格,因此call出来的SNVs数量是最少的,GATK 和 SAMtools call出来的数量位于SOAPsnp 和 Atlas-SNP2之间;四种calling算法的整体一致性是很低的,尤其在non-dbSNPs数据库中;GATK 和 Atlas-SNP2有较高的阳性call率和灵敏性,GATK call出来的SNVs数量比较多。

    1、dbSNP数据库和non-dbSNPs在用四种不同软件call出来的SNVs的比较
    对于修剪过的reads(指的是去除低质量的碱基),在四种分析软件中,dbSNP数据库一致性比non-dbSNP数据库好,因为dbSNP数据库的variants位置更常见,因此比较容易被call出来

    2、raw reads和修剪过的reads(指的是去除低质量的碱基),call出来的SNVs数量比较:

    比起raw data,修剪过的reads,call出来的variants会比较多,SOAPsnp call出来的variants比其他三个软件多,可能是因为这个软件对SNP filter的要求没那么严格

    3、不同碱基覆盖度阈值时,四种不同软件call出来的SNVs比较:

    碱基覆盖度由3X上升到4X时,SNVs call出来的数量骤然下降了50%,当上升到10X时,call率下降了15%。SOAPsnp call出来的变异是最多的,Atlas-SNPs call 率是最少。然而,对于同一个软件来说,随着碱基覆盖度上升,call出来的数量变少的趋势在变慢

    参考文献:Yu, Xiaoqing, and Shuying Sun. "Comparing a few SNP calling algorithms using low-coverage sequencing data." BMC bioinformatics 14.1 (2013): 274.

  • 相关阅读:
    php面向对象开发的学习
    我的php感悟
    说说面向对象
    session,上传文件
    PHP构造函数的用法分析
    生成图片
    上传文件
    fetch
    ajax2
    ajax1
  • 原文地址:https://www.cnblogs.com/chenwenyan/p/8258911.html
Copyright © 2020-2023  润新知