• TCDB 数据库简介


    TCDB是对膜转运蛋白(Membrane Transport Protein)进行分类的一个数据库,它制定了一套转运蛋白分类系统(Transporter Classification), 简称TC System, 类似于对酶进行分类的EC系统,只不过TC系统同时提供了功能和进化信息;

    TCDB对于每一个转运蛋白家族,提供了一个TC Nmuber, TC Number 由小数点分隔的5为数字或者字母构成

    目前TCDB提供了超过800个转运蛋白家族, 包含10000多条唯一的蛋白质序列和10000多篇文献

    数据库网址如下:

    http://www.tcdb.org/

     对于整个TC 分类系统而言,包含5个层级的分类,所以TC Number 包含5个数字或者字母, 每个数字或字母实际代表某一个层级的分类结果,第一级分类包括以下几个大类:

    http://www.tcdb.org/browse.php

    点击左侧的+,可以对某个具体的分类进行展开,这样就可以看到其包含的具体的分类系统

    对于TCDB而言,是可以免费下载的,下载的链接如下:

    http://www.tcdb.org/download.php

    点击 TCDB FsatA Sequences 超链接,下载所有的序列,下载下来的序列内容如下:

    >gnl|TC-DB|1001796365|4.F.1.1.5 CDP-alcohol phosphatidyltransferase [Marinobacter excellens]
    MDSIRPATFQIPAAVRELGWAALLLFFVLLSVHEWFSPPGWFGLLAILIFATQGALILTR
    WPARQNFGWANRTTLLRSILVVSLVAWAPFLPAADSSALWIYGVACLIALILDGVDGKVA
    RATNSNSEFGARFDMELDALFIFGLCVATMAIGKAGPWVLMLALMRYAFLAASHFLTWLN
    QPLPDSFRRKTVCVWQVVTLMIAILPPTPTGFAGTTLAMALALLGWSFALDVRWLYQRRH
    YHEN

    在序列标识符中,1001796365 代表该蛋白质序列在GeneBank 数据库中的编号, 4.F.1.1.5 是TC Number, 代表该蛋白质所属的转运蛋白家族,CDP-alcohol phosphatidyltransferase 是对该转运蛋白家族功能的具体描述,[Marinobacter excellens] 是该蛋白序列的来源物种

    有了fasta序列之后,我们可以对序列进行TCDB的功能注释了

    TCDB还提供了TCID 与其他数据库的关联,点击ID Mapping 超链接,可以看到下图:

    以GO 数据库为例,go.tsv 文件中的部分内容如下:

    GO:0008076      1.A.1.1.1        Voltage-gated Ion Channel (VIC) Superfamily .
    GO:0005249      1.A.1.1.1        Voltage-gated Ion Channel (VIC) Superfamily .
    GO:0006813      1.A.1.1.1        Voltage-gated Ion Channel (VIC) Superfamily .
    GO:0008076      1.A.1.2.2        Voltage-gated Ion Channel (VIC) Superfamily .
    GO:0005515      1.A.1.2.2        Voltage-gated Ion Channel (VIC) Superfamily .
    GO:0005249      1.A.1.2.2        Voltage-gated Ion Channel (VIC) Superfamily .
    GO:0006813      1.A.1.2.2        Voltage-gated Ion Channel (VIC) Superfamily .
    GO:0055085      1.A.1.2.2        Voltage-gated Ion Channel (VIC) Superfamily .
    GO:0043005      1.A.1.3.1        Voltage-gated Ion Channel (VIC) Superfamily .
    GO:0043025      1.A.1.3.1        Voltage-gated Ion Channel (VIC) Superfamily .

    可以看到保存的实际是TC Number 和 GO的对应关系,其他的文件内容是类似的,只不过link的数据库不一样。

  • 相关阅读:
    EasyExcel无法用转换器或者注解将java字段写入为excel的数值格式
    IE浏览器报400错误:Invalid character found in the request target. The valid characters are defined in RFC 7230 and RFC 3986
    list集合根据字段分组统计转换成map
    博客调网易云歌单JS
    如何一次性add library to classpath
    有趣的统计数据表格显示
    span标签的巧用
    "错误: 找不到或无法加载主类"解决办法
    通过改变注入方式以消除警告
    day17--作业
  • 原文地址:https://www.cnblogs.com/xudongliang/p/7268076.html
Copyright © 2020-2023  润新知