1.参考流程:https://mp.weixin.qq.com/s?__biz=MzI1MjU5MjMzNA==&mid=2247484466&idx=1&sn=24b0bbb405afd1b5deec696811c116ef&chksm=e9e02d93de97a4859122c4cff5d3b30de59c2f89cc4267b737a410642177a21b3c09f48e4155&scene=21#wechat_redirect
参考文献:
A survey of best practices for RNA-seq data analysis
Gaining comprehensive biological insight into the transcriptome by performing a broad-spectrum RNA-seq analysis
2.根据上述网站,自己实战的一些情况;关于软件的安装这块,经过自己的填坑经验,建议大家使用
bioconda来安装相应的生物学软件。(bioconda的使用参见网站:https://zhuanlan.zhihu.com/p/25085567 以及 http://python.jobbole.com/86236/)
3.根据参考文章下载相应的数据:(NCBI-GEO数据库)
4.下载参考基因组(UCSC/NCBI/)
5.数据的格式转换及fastqc质控(参考:http://www.cnblogs.com/lmt921108/p/7442617.html)
6.利用HISAT2建立索引文件:hisat2-build -p 2 genome.fa genome(参考:http://blog.sciencenet.cn/blog-759995-990471.html)
7.利用HISAT2进行序列比对:hisat2 -p -x genome -1 SRR35899_1.fastq.gz -2 SRR35899_2.fastq.gz -S SRR35899.sam (我的数为双末端测序结果)
8.利用上述命令得出的结果发现:比对率很低,解决办法参考网站(https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247483891&idx=1&sn=b7944d4c1bd5cd651bcc4bdf92e9266b&scene=21#wechat_redirect)
该网站上有一个参数--local,本人刚开始照着做时,命令如下:
hisat2 -p -5 5 -3 10 --local -x genome -1 SRR35899_1.fastq.gz -2 SRR35899_2.fastq.gz -S SRR35899.sam
然后程序就报错了,提示没有--local这个参数。去掉该参数重跑,OK,正确。【所以说,有时候具体问题具体分析】