标签:
转载 |
原文地址:FPKM与RPKM作者:Fiona_72965
定义:
FPKM:Fragment Per Kilobase of exon model per Million mapped reads;每1百万个map上的reads中map到外显子的每1K个碱基上的Fragments个数。在ref中,使用FPKM;
RPKM:Reads Per Kilobase of exon model per Million mapped reads;每1百万个map上的reads中map到外显子的每1K个碱基上的reads个数。在denovo中,使用RPKM;
区别:
转录组测序采取PE100的测序策略,会得到R1和R2两条序列
不管是denovo还是ref,在做样品表达定量时是均是将reads比对到参考基因组上(不同的是ref的参考基因组用的是数据库下载的基因组序列,denovo用的是trinity拼接得到的、去冗余的unigene)。有参考的RNA-seq 把paired 的R1,R2 成对数据当作1个fragment ,用于发现junction位点,可变剪切,基因融合等等
ref定量样品表达量使用的tophat软件,会将R1和R2作为整体一起比对到参考基因组,因此mapp到基因组的是R1和R2一对序列,被定义为1个Fragment。
而对于denovo,使用bowtie进行表达量定量,在将序列比对到unigene时,会将R1和R2分别看成两个single read序列,会先将R1比对到参考基因组,再将R2比对到参考基因组,因此用RPKM进行定义。
公式=该基因reads数/(基因长度*所有reads数)106 FPKM小于等于两倍的RPKM
|