R语言零基础基因/数据差异分析(一)
文章目录
介绍
环境搭建
软件下载
结果展示
基因数据下载流程
基因数据处理
利用GEO分析绘制拟火山图
注意,本 系列 有连贯性,每一步都很详细,每一步都很重要,请耐心读完!!
介绍
本系列文主要依据真实论文制图流程,详细说明制图过程,
其中包括:
1. 基因数据下载
2. 制图所需数据格式
3. 火山图制作流程
4. 聚类热图制作流程
1
2
3
4
5
6
环境搭建
软件下载
移步至此学习
结果展示
基因数据处理
注意删除末行注释
基因数据下载流程
以GSE137578基因为例,先下载 如图所示文件,并解压如图。
1.
2.
3.新建一个excel,并将解压好的文本拖进去。
4.注意,打开后,此时我们需要对数据进行处理。
基因数据处理
1. 在以 !开头的行,均是**注释行**,要全部删除,如图示,
2. 删除方法:选择好区域后,右键,删除整行即可
1
2
删除之后:
注意,尾部图片选择的整行都要删除:
删除尾部结果:
对于上述数据,我们所需要数据结构模样如上。
注意,我们上述下载的是基因实验数据,它用于绘制热图,这在第三章会详细说明,这里点击另存CSV即可。
利用GEO分析绘制拟火山图
1.点击分析
2. 如图步骤,
1.按住 Shift 选择组别,
2.标记组别
3.如此选择完你的组别
3. 进行分析
4.注意下面我们要绘制的火山图模样,我们点击下载表格即可
4. 文件格式是 tsv,我们利用excel打开,注意,在绘制热图时,我们需要它,所以,请进行备份!
5. 在这里,我们只保留以下列,注意记住以下列的名字,这非常重要,它将决定代码是否成功运行!
保留的列头行名:
GB_ACC(这是基因名,每个文件有所不同,按己索需)
P.Value(这里改名为FDR)
logFC
adj.P.Val
你只要记住你要保留的每行头个单元名称即可,至于是什么,自己可决定。
我们如下整理,请将非数据列放到开头。
注意名称和另存格式
之后,我们将利用此绘制火山图。
————————————————
版权声明:本文为CSDN博主「Frms」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_39751227/article/details/118757653