做完mapping之后,需要知道mapped reads在基因组上的分布,所以尝试在ubuntu系统中使用IGV软件,简单记录使用过程,如下:
1.下载IGV软件
去IGV官网: http://www.broadinstitute.org/software/igv/download,下载 binary distribution类型软件
2.运行IGV软件
软件下载后,直接解压。在命令行运行:sh IGV_2.3.77/igv.sh,打开IGV界面。
注意:IGV 需要java运行环境,另外ubuntu系统需要安装X11
3.设定基因组
软件提供了一些基因组供直接选择,若需要的基因组不在选向范围内可以自己导入基因组,方法:
1)对基因组建立index:samtools faidx genome.fa,得到名为genome.fai的index文件
2)上传基因组,软件不支持压缩格式:Genomes->Load Genome from File->选择genome.fa并打开
4.打开mapping得到的BAM文件
1)sort BAM 文件:samtools sort sample.bam -o sample.sort.bam
2)对BAM文件建立index:samtools index sample.sort.bam
3)上传sort后的BAM文件:File->Load from File->选择sample.sort.bam并打开
5.查看展示的结果
Integrative Genomics Viewer(IGV) 是一种探索大型综合基因组数据的高性能交互式可视化工具。它支持各种各样的数据类型,包括基于芯片测序、二代测序数据和基因组注释数据等。详细信息:http://www.broadinstitute.org/software/igv/
1、使用igvtools 将*.bam文件转换成相应的*.tdf文件(节省空间),*.tdf文件有其对应的可查看的文本*.wig文件。
在大型机上将igvtools压缩包上传到个人工作目录,解压,然后在.bashrc_programs中加载包的路径即可使用。格式转换命令如下:
igvtools count -z 5 -w 25 *.bam *.bam.tdf hg19
igvtools count -z 5 -w 25 *.bam *.bam.wig hg19
(help文件说tdf和wig可以同时转,中间用逗号隔开即可)
-z 分配最大的zoom level 水平
-w 每个track记录的碱基数
…
**提示:使用igvtools命令时要使bam.bai文件(bam的索引文件,可用samtools的index命令建立索引文件)与bam文件在同一个文件夹中
(更多参数参见http://www.broadinstitute.org/software/igv/igvtools_commandline 或者 igvtools help count)
2、本地安装igv 在igv官网下载界面进行下载
(http://www.broadinstitute.org/software/igv/download)
windows用户下载 Download Binary Distribution ,下载后解压,运行igv.jar 文件即可
再用file -> load from file 选项导入*.tdf文件,在导入文件之前要选则自己需要的参考基因组,在此包括人、牛、马、鸡、猩猩、狗、小鼠、线虫、果蝇、噬菌体等等。
3、导入后查看填写图片摘要(选填
1)在选择感兴趣的区域时,应先单击染色体,当按钮从灰色变成有红色时再点击它,并在染色体区域选择感兴趣的起始位置即可,无需拖拽。
2)选择想要查看的基因列表,如下图所示
3)输入序列集以及参考基因组的各项参数调整。
包括调整每个track的颜色、高度,字体大小,图形的表现形式(包括热图、条形图、点图、线图)以及一些其他图示参数。参考基因组的展现形式包括collapsed、expanded、squished三种。
4)一些更深入的调节与查看
View –>preference 则出现以下图框,有多重参数调整,具体的选择根据个人需要而定。
View ->color legends 调整相应图标的颜色(这是在包含有这些数据类型的输入数据可做的颜色调整)
5)一些快捷键的使用参见
http://www.broadinstitute.org/software/igv/keyboard_shortcuts
4、图片下载
File –>save image 选择存储路径即可