• 转录组表达量计RPKM、FPKM、TPM说明


    在转录组测序(RNA-Seq)中,基因的表达量是我们关注的重点。基因表达量的衡量指标有:RPKM、FPKM、TPM。

    RPKM:Reads Per Kilobase Million;说实话,这个英文说明真的很费解,其实可以理解为“Reads Per Kilobase Per Million Reads”​,即“每一百万条Reads中,对基因的每1000个Base而言,比对到该1000个base的Reads数”,计算公式。

    FPKM:Fragments per Kilobase Million,FPKM意义与RPKM极为相近。二者区别仅在于,Fragment 与 Read。RPKM的诞生是针对早期的SE测序,FPKM则是在PE测序上对RPKM的校正。只要明确​Reads 和 Fragments的区别,RPKM和FPKM的概念便易于区分。Reads即是指下机后fastq数据中的每一条Reads,Fragments则是指每一段用于测序的核酸片段,在SE中,一个Fragments只测一条Reads,所以,Reads数与Fragments数目相等;在PE中,一个Fragments测两端,会得到2条Reads,但由于后期质量或比对的过滤,有可能一个Fragments的2条Reads最后只有一条进入最后的表达量分析。总之,对某一对Reads而言,这2条Reads只能算一个Fragments,所以,Fragment的最终数目是Reads的1到2倍之间。

    TPM:​Transcripts Per Million,这个英文也很费解。先不纠结字面意思了,直接解释它的计算方法。TPM的计算分3步:

    step1:根据基因/转录本长度​校正count值;假设某基因count值为R1,则校正后count值为:

    R1/(L1/1000)​;  

    注: L1为该基因的长度;

    step2:计算total 校正后count值;即所有基因的校正后count值​总和,Rtotal;

    step3:计算TPM;TPM​结果为:

    R1*1000*1000000/(L1*​Rtoatl)。

  • 相关阅读:
    SVM+HOG特征训练分类器
    数字图像处理的基本原理和常用方法
    c++中二进制和整数转化
    目标检测——HOG特征
    相似图片搜索的原理和实现——颜色分布法
    测试文本文件大小
    Direct2D 图形计算
    Direct2D 如何关闭抗锯齿
    MFC窗口显隐
    CISP/CISA 每日一题 22
  • 原文地址:https://www.cnblogs.com/jinhh/p/8964790.html
Copyright © 2020-2023  润新知