• DEPICT实现基因优化(gene prioritization)、gene set富集分析(geneset enrichment)、组织富集分析(tissue enrichment)


    全基因组关联分析除了找到显著的关联位点,我们还可以做基因优化、geneset富集分析、组织富集分析,下面具体讲一讲怎么利用GWAS的summary数据做这个分析。

    summary数据就是关联分析的结果文件

    1 软件安装前请确保需要满足的系统环境

    1.1 支持Mac OS X 或者 UNIX, 不支持windows系统
    1.2 Java SE 6(或者更高),没有安装Java请自行安装
    1.3 需要PIP

    怎么确定系统有没有安装PIP呢,输入命令which pip,如果没有路径弹出,说明没有PIP,需要安装

    1.4 需要Python依赖包

    pip install intervaltree

    或者

    conda install -c conda-forge intervaltree

    1.5 需要Pandas包 (0.15.2或者以上版本)

    pip install pandas

    1.6 PLINK(1.9 版本)
    1.7 python(2.7 版本)

    2 下载、安装

    wget http://www.broadinstitute.org/mpg/depict/depict_download/bundles/DEPICT_v1_rel194.tar.gz

    tar -zxvf DEPICT_v1_rel194.tar.gz

    3 测试depict能否运行

    cd DEPICT

    ./src/python/depict.py ./example/ldl_teslovich_nature2010.cfg

    如果这一步没有报错,说明环境配置没有问题,可以开始分析自己的数据啦

    4 准备一份新的cfg文件

    拷贝yourtrait.cfg文件

    cp ldl_teslovich_nature2010.cfg yourtrait.cfg

    编辑yourtrait.cfg文件

    vi yourtrait.cfg

    vi进去后,yourtrait.cfg文件有几处需要修改

    4.1 修改summary文件,这个summary文件即为你想分析的表型关联分析文件,在这里,假定叫做yourtrait.glm.linear,注意前面要加上绝对路径

    gwas_summary_statistics_file: /your/path/to/summary/file/yourtrait.glm.linear

    4.2 修改输出文件名,文件名按你喜欢修改,这里依旧假定命名为yourtrait

    label_for_output_files: yourtrait

    4.3 修改P值名称,如果yourtrait.glm.linear的P值用P表示的话

    pvalue_col_name: P

    4.4 修改染色体名称,如果yourtrait.glm.linear的染色体用Chr表示的话

    chr_col_name: Chr

    4.4 修改位置名称,如果yourtrait.glm.linear的位置用Pos表示的话

    pos_col_name: Pos

    4.5 添加PLINK软件的绝对路径,PLINK在你系统的哪个位置就写上哪里

    plink_executable: /your/path/to/plink/plink

    4.6 添加plink格式的genotype数据

    genotype_data_plink_prefix: /your/path/to/genotype/yourtrait_genotype

    修改好以上数据后,保存退出文件:wq

    5 跑数据

    ./src/python/depict.py yourtrait.cfg

    6 生成文件

    生成的文件分别为loci.txt,geneprioritization.txt, genesetenrichment.txt , tissueenrichment.txt,其中,geneprioritization.txt, genesetenrichment.txt , tissueenrichment.txt即为我们感兴趣的基因优化,geneset富集分析,组织富集分析

    7 画图

    Rscript ./DEPICT/src/python/tissue_plot.R ./DEPICT/example/ldl_teslovich_nature2010_tissueenrichment.txt ldl_teslovich

    nHjH5q.png

  • 相关阅读:
    Halcon学习(车牌识别)
    Keil新建STM32工程(LED灯)
    Keil新建STM32工程(LED灯)
    Keil STM32F4xx_DFP.1.0.8.pack下载链接
    android 如何单独编译 img及作用
    Linux绑定硬件IRQ到指定SOC的CPU核
    sysrq: SysRq : HELP : loglevel(0-9) reboot(b) crash(c) terminate-all-tasks(e) memory-full-oom-kill(f)
    内核线程同步之completion
    kmalloc,vmalloc , malloc
    ARMv8 与 Linux的新手笔记(转载)
  • 原文地址:https://www.cnblogs.com/chenwenyan/p/11547974.html
Copyright © 2020-2023  润新知