RNA_seq GATK 最佳实践

GATK处理DNA 水平的snp 经验比较成熟，而RNA 水平较少，所以可能会存在错误

目前的流程兼顾了假阳性（不是真的snp位点）和假阴性（该位点是snp,却没有检测到）；后续会不断改善

GATK SNP calling pipeline 分成3个部分：

1）DATA CLEANUP

2) VARIANT DISCOVERY

3) EVALUATION

DATA CLEANUP ：

1）raw reads 和参考基因组比对（推荐使用STAT 2-pass）

STAR 建立参考基因组的索引

1-pass 比对：

先用第一次比对生成的SJ.out.tab 文件，重新建立索引：

2-pass 比对：

2） mark duplicates and sort

picard 标记重复序列，并sort

3) split N and reassignMappingQuality

4）Indel realignment （可选的）

5）base recalibration

6） variant calling

7）variant filter

参考资料：

相关阅读:
ajax traditional
阿里云OSS NET SDK 引用示范程序
js对象的两种写法
BZOJ NOIP提高组十连测第一场
ikbc 时光机 F87 Ctrl 失灵解决办法
【读书笔记】阅读的危险
51nod 1118 机器人走方格解题思路：动态规划 & 1119 机器人走方格 V2 解题思路：根据杨辉三角转化问题为组合数和求逆元问题
【算法】求逆元模板
【复习资料】软件工程之快速原型模型
VirtualBox安装linux mint教程

原文地址：https://www.cnblogs.com/xudongliang/p/7340026.html