• KEGG 数据库本地化(enrichKEGG)


    在使用clusterProfiler时,KEGG注释包,可以自定义。毕竟许多物种的数据库是不完善的。
    现在就自定义一个KEGG.db的包,用于KEGG注释。

    第一步,先去上述官方地址找到自己研究的物种在KEGG数据里的3字符缩写,比如:人的缩写是hsa

    #安装Y叔的包,
    #安装创建KEGG数据库的包的包
    install.packages(remotes)
    library(remotes) remotes::install_github("YuLab-SMU/createKEGGdb") #创建自己的物种的包create_kegg_db,会自动创建名称为KEGG.db_1.0.tar,gz的包。物种名称的简写,在 createKEGGdb::create_kegg_db("hsa") #安装这个包(默认的包的路径在当前工作目录,根据实际情况修改路径) install.packages("KEGG.db_1.0.tar.gz",repos=NULL,type="source")

    把KEGG数据库本地化的好处是可重复性好。对于同一批数据可以用同一个数据库,不会因网络端更新而前后结果不一致。

    快速上手生成KEGG.db,到此已结束。

    测试本地的包

     

    library(KEGG.db)
    library(clusterProfiler)
    data(geneList,package="DOSE")
    head(geneList)
    gene <- names(geneList)[abs(geneList) > 2]
    head(gene)
    kk <- enrichKEGG(gene= gene,organism= 'zma',pvalueCutoff = 0.05,qvalueCutoff = 0.05,use_internal_data =T)
    #当使用本地的KEGG.db数据库时,use_internal_data设置为T,使用在线数据库时设置为F.
    head(kk)
    nrow(kk)
  • 相关阅读:
    工程思维
    小骆驼 第三章 列表与数组
    小骆驼 第二章 标量数据
    小骆驼 第二章 标量数据
    小骆驼 第二章 标量数据
    split和join合写
    Competition and Predation
    What is the difference between Θ(n) and O(n)?
    数学基础之概率统计
    enumerate()函数
  • 原文地址:https://www.cnblogs.com/0820LL/p/16136211.html
Copyright © 2020-2023  润新知