• 生物信息学练习1-综合使用软件


    本次的任务是对三组儿童的肠道宏基因组测序序列进行数据挖掘。我负责的是2-3 years old,control,十个双端测序数据。

    *****************************************我是分割线***********今天没有心情卖萌**************************************************************

    Step1:

    新建文件夹:20161205

    bowtie2-build /home/pxy7896/Desktop/20161205/GCF_000001405.35_GRCh38.p9_genomic.fna human

    Step2:查看数据的质量。是否与人类基因组近似?

    Step3:

    描述物种分类

    for f in *.fastq.gz

    do

    metaphlan2.py $f --input_type fastq --nproc 4 > ${f%.fastq.gz}_profile.txt

    done

    合并表格

    /home/pxy7896/Downloads/metaphlan2/utils/merge_metaphlan_tables.py *_profile.txt > merged_abundance_table.txt

    绘制热图:

    /home/pxy7896/Downloads/metaphlan2/utils/metaphlan_hclust_heatmap.py -c bbcry --top 25 --minv 0.1 -s log --in merged_abundance_table.txt --out result/abundance_heatmap.png

    感觉应该把pe-1pe-2放在一起,而且pe-1pe-2的差距本就不大。所以尝试合并的情况:

    IDs="G45084 G45072 G45071 G45109 G45125 G45124 G45049 G45054 G45121 G45099"

    for s in ${IDs}

    do

    metaphlan2.py ${s}_pe_1.fastq.gz,${s}_pe_2.fastq.gz --bowtie2out result1/${s}.bowtie2.bz2 --nproc 5 --input_type fastq > result1/profiled_${s}.txt

    done

    查看cpu情况:

    然后合并表格:

    /home/pxy7896/Downloads/metaphlan2/utils/merge_metaphlan_tables.py profiled_*.txt > merged_abundance_table.txt

    重新绘制热图:

    /home/pxy7896/Downloads/metaphlan2/utils/metaphlan_hclust_heatmap.py -c bbcry --top 25 --minv 0.1 -s log --in merged_abundance_table.txt --out abundance_heatmap.png

    修改命令,展示所有的种类,而非top25 ,并修改精度为 0.01

    /home/pxy7896/Downloads/metaphlan2/utils/metaphlan_hclust_heatmap.py -c bbcry --minv 0.01 -s log --in merged_abundance_table.txt --out abundance_heatmap_2.png

    Step4:

    使用上一步得到的merged_abundance_table.txt,画cladogram。

    **************************************************此处开始用的是我自己的电脑,后面绘图的部分今晚填坑******************************************************************************

    /home/pxy7896/.linuxbrew/Cellar/graphlan/0.9.7/bin/export2graphlan.py --skip_rows 1,2 -i merged_abundance_table.txt --tree merged_abundance.tree.txt --annotation merged_abundance.annot.txt --most_abundant 100 --abundance_threshold 1 --least_biomarkers 10 --annotations 5,6 --external_annotations 7 --min_clade_size 1

    /home/pxy7896/.linuxbrew/Cellar/graphlan/0.9.7/bin/graphlan_annotate.py --annot merged_abundance.annot.txt merged_abundance.tree.txt merged_abundance.xml

    /home/pxy7896/.linuxbrew/Cellar/graphlan/0.9.7/bin/graphlan.py --dpi 300 merged_abundance.xml merged_abundance.png --external_legends

    看一下啊=。=

    ***********************************************************************填坑专用链接哦==*******************************************************************************

    https://bitbucket.org/nsegata/metaphlan/wiki/MetaPhlAn_Pipelines_Tutorial

    PS:

    1. 单独查看内存使用情况的命令:free -m;查看内存及cpu使用情况的命令:top,再输入1

    也可以安装htop工具,sudo apt-get install htop

    安装完后,直接输入命令:htop

    2. 远程连接

    http://www.linuxidc.com/Linux/2016-06/132442.htm

    参考上面这篇设置好ubuntu后,记录ubuntuip地址(ifconfig

    然后在win7下使用软件RealVNC ,输入ip和密码即可。

    https://www.realvnc.com/download/viewer/

     

  • 相关阅读:
    ubuntu 安装 redis desktop manager
    ubuntu 升级内核
    Ubuntu 内核升级,导致无法正常启动
    spring mvc 上传文件,但是接收到文件后发现文件变大,且文件打不开(multipartfile)
    angular5 open modal
    POJ 1426 Find the Multiple(二维DP)
    POJ 3093 Margritas
    POJ 3260 The Fewest Coins
    POJ 1837 Balance(二维DP)
    POJ 1337 A Lazy Worker
  • 原文地址:https://www.cnblogs.com/pxy7896/p/6136942.html
Copyright © 2020-2023  润新知