CIRI 识别circRNA的原理

CIRI 识别circRNA的原理

CIRI 根据circRNA 连接点处的reads来识别circRNA，在连接点处的reads 其比对情况非常特殊；

CIRI 根据3种模型来识别circRNA，连接点处的read 叫做junction read

A)

circRNA 由3个外显子环化形成，由于测序读长的限制，junction read 只覆盖了起始外显子和终止外显子的部分序列，这两部分reads的比对位置在基因组上的位置是相反的，

B）

circRNA 由3个外显子环化形成，由于连接点处的一个外显子其长度太短，junction read 除了覆盖了起始外显子和终止外显子的两部分序列外，还覆盖了中间的一个外显子的部分序列

C)

circRNA 由1个外显子环化形成, junction read 除了覆盖了整个外显子外，还重复又读了一部分序列

D）

为了进一步降低假阳性率，CIRI 通过以下3条规则对结果进行过滤：

1）双端测序的两条reads 必须符合PEM 信号，以上面的示意图为例，进行说明

read1 是一条junction read, 来源于两个外显子，根据read1 的比对情况，确定了circRNA 在基因组上的位置，此时，如果这个circRNA 识别准确，那么read2 就肯定落在对应的位置内；

根据两条reads的比对情况，进一步过滤结果；

2）检测到的circRNA 的连接处符合AG-GT 剪切信号；

3）根据比对的质量和数量进行过滤，质量就是说mapping 的质量越高，识别的circRNA 越准确；数量就是说对于某个circRNA来说，检测到的juntion reads 越多，说明这个circRNA越可靠；

上面图中的几种模型只是帮助我们理解了exonic-circRNA的检测，其实对于non-exonic circRNA（包括intronic circRNA 和 intergenic circRNA)的检测，其原理是相似的，只是综合考虑了测序读长和连接点两段序列的长度，提出几种可能的比对模型，然后根据比对模型来检测对应的junction reads, 从而预测circRNA;

circRNA 结果的验证：
以一个预测得到的circRNA chr2: 58,311,224|58,316,858 为例，在基因组上的长度为 5634bp, 其连接点为VRK2基因的exon6和exon10

理论上产生的circRNA的序列为所有外显子组成的序列，splicing length为407bp

为了验证该circRNA , 根据连接点两端的序列设计引物，扩增出该circRNA 片段，跑电泳，确定产物长度

图中的黑色片段为扩增产物的条带，根据PAGE 电泳的结果，确定其长度；然后进行一代测序，确定具体序列

参考文献：https://genomebiology.biomedcentral.com/articles/10.1186/s13059-014-0571-3
相关阅读:
Spring--自定义注解
 IntelliJ IDEA实用插件
 Zero date value prohibited解决方法
 如何保证幂等性
 Map遍历的几种方式
 Static关键字
 索引失效 -- 使用Between范围查询时
 接口的不同写法在Swagger上的不同
 js与jquery获取input输入框中的值
 一个简单的 aiax请求例子
原文地址：https://www.cnblogs.com/xudongliang/p/6737445.html