• CIRI 识别circRNA的原理


     CIRI 根据circRNA 连接点处的reads来识别circRNA, 在连接点处的reads 其比对情况非常特殊;

    CIRI 根据3种模型来识别circRNA, 连接点处的read 叫做junction read

    A)

    circRNA 由3个外显子环化形成, 由于测序读长的限制,junction read 只覆盖了起始外显子和终止外显子的部分序列,这两部分reads的比对位置在基因组上的位置是相反的,

    B)

    circRNA 由3个外显子环化形成, 由于连接点处的一个外显子其长度太短,junction read 除了覆盖了起始外显子和终止外显子的两部分序列外,还覆盖了中间的一个外显子的部分序列

    C)

    circRNA 由1个外显子环化形成, junction read 除了覆盖了整个外显子外,还重复又读了一部分序列

    D)

    为了进一步降低假阳性率,CIRI 通过以下3条规则对结果进行过滤:

    1)双端测序的两条reads 必须符合PEM 信号,以上面的示意图为例,进行说明

    read1 是一条junction read, 来源于两个外显子,根据read1 的比对情况,确定了circRNA 在基因组上的位置,此时,如果这个circRNA 识别准确,那么read2 就肯定落在对应的位置内;

    根据两条reads的比对情况,进一步过滤结果;

    2) 检测到的circRNA 的连接处符合AG-GT 剪切信号;

    3)根据比对的质量和数量进行过滤,质量就是说mapping 的质量越高,识别的circRNA 越准确;数量就是说对于某个circRNA来说,检测到的juntion reads 越多,说明这个circRNA越可靠;

    上面图中的几种模型只是帮助我们理解了exonic-circRNA的检测,其实对于non-exonic circRNA(包括intronic  circRNA 和 intergenic circRNA)的检测,其原理是相似的,只是综合考虑了测序读长和连接点两段序列的长度,提出几种可能的比对模型,然后根据比对模型来检测对应的junction reads, 从而预测circRNA;

    circRNA 结果的验证:
    以一个预测得到的circRNA chr2: 58,311,224|58,316,858 为例,在基因组上的长度为 5634bp, 其连接点为VRK2基因的exon6和exon10

     

     理论上产生的circRNA的序列为所有外显子组成的序列,splicing length为407bp

    为了验证该circRNA , 根据连接点两端的序列设计引物,扩增出该circRNA 片段,跑电泳,确定产物长度

    图中的黑色片段为扩增产物的条带,根据PAGE 电泳的结果,确定其长度;然后进行一代测序,确定具体序列

     参考文献:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-014-0571-3

  • 相关阅读:
    Spring--自定义注解
    IntelliJ IDEA实用插件
    Zero date value prohibited解决方法
    如何保证幂等性
    Map遍历的几种方式
    Static关键字
    索引失效 -- 使用Between范围查询时
    接口的不同写法在Swagger上的不同
    js与jquery获取input输入框中的值
    一个简单的 aiax请求例子
  • 原文地址:https://www.cnblogs.com/xudongliang/p/6737445.html
Copyright © 2020-2023  润新知