RNAcentral 是EBI 开发的一个非编码RNA的数据库。
网址如下:
http://rnacentral.org/
RNAcentral 整合了包括 Ensembl, GENCODE,Greengenes, HGNC, LNCipedia, lncRNAdb, miRbase, NONCODE,RDP, RefSeq, Rfam, SILVA 在内的多个数据库,完整的数据库列表见如下链接:http://rnacentral.org/expert-databases。对于每一条非编码RNA的序列,RNAcentral 会给每一条RNA 序列1个唯一的编号Unique RNA Sequence identifier,前缀为URS ,后面是10个数字和字母的组合,比如URS0000000001, URS00000478B7; URS 编号符合 /URS[0-9A-F]{10}/ 正则表达式。
这个数据库每3个月更新1次,目前的最新版本为V8
RNAcentral 提供了3种检索方式:
1) 通过 text search 这种检索方式,我们可以选择下列 几种过滤方式,对数据进行筛选,
筛选好之后,可以点击右上角进行下载:
2) 通过 sequence search 检索方式,我们可以对一条序列进行注释,
输入一条fasta 序列,RANcentral 会使用 nhmmer 进行比对,将比对上的数据库中的序列输出,这样我们就可以对序列进行注释了,判断它是哪种非编码RNA;
3) Genome broswer 提供了基因组浏览器,可以选择物种,染色体位置,查看某一段区间上的基因和序列分布
该网站的序列是可以免费下载的,提供了FTP 下载和RESTful API, 方便写代码抓取网站的数据。