（转）转录组福音 | 基于表达谱研究疾病七大思路汇总

（转）转录组福音 | 基于表达谱研究疾病七大思路汇总

收藏|基于表达谱研究疾病七大思路汇总 - 生信人

IF：9|全新的疾病特征基因筛选策略 - 生信人

昨天我们推广的疾病的分析思路，火爆网络，索性今天再来一个返场小段，供大家消遣一下。
因为大部分的疾病不致死，或者说预后部分的信息收集并不全面，所以在做生信分析的时候跟肿瘤相比，就缺了最重要的一步预后效果验证如何。
我们之前说过肿瘤筛选marker有三大步骤，差异，降维，预后。
但是对于疾病来说没有了预后，文章思路就不完整了。
小编今天通过对AD研究的几篇文章来简单介绍下如果没有预后，我们如何研究，如何分析。

1、核心基因+多因子（6+）
2、WGCNA+多样本验证（3+）
3、WGCNA+多因子（1.9）
4、Network&pathway（2.4）
5、CeRNA思路：多套数据整合（3.6）
6、基因诊断模型+WB验证（2.8）
7、lncRNA诊断模型+SVM（8.9）

有生信分析需求
请扫码添加微信
获取更多疾病相关思路

一、核心基因+多因子
Identification of molecular signatures and pathways to identify novel therapeutic targets in Alzheimer's disease: Insights from a systems biomedicine perspective
（Genomics IF: 6+）
核心基因是公号去年推广的一个免费视频，简单说来就是GEO数据筛选差异，通过网络降维，然后TCGA预后验证。但是如果对于疾病没有了预后，通常我们会增加TF、miRNA、Drug等因子的研究，筛序到核心的基因，再拓展下相关的因子、药物等等。

二、WGCNA+多样本表达验证
Identification of KIAA0513 and Other Hub Genes Associated With Alzheimer Disease Using Weighted Gene Coexpression Network Analysis
（Froniter in genetics IF: 3+）
这篇文章研究的是颞叶皮层AD样本的WGCNA分析，筛选到核心模块和基因之后，还是缺点东西，所以作者选择了去用其他的组织样本进行表达验证，甚至用了老鼠的样本。
同时，作者深知分析内容不够，生信来凑的实际情况，于是这篇文章的图，超级精美。

看到这有小伙伴就说了，难道不能WGCNA筛选降维之后，看看多因子么，当然可以。

三、WGCNA+多因子
Screening and Identification of Potential Peripheral Blood Biomarkers for Alzheimer’s Disease Based on Bioinformatics Analysis
(medical science monitor IF: 1.9+)
还记得小编说过的吧，要保证思路、分析、数据至少有一个不一样。
这篇文章也是WGCNA，虽然后面成了多因子，但是呢如果样本也都一样，还是有作弊的嫌疑。
但是呢，作者很厉害，选择的是PBMC的数据。
分析内容为筛选差异，WGCNA筛选核心基因和模块，富集分析，然后针对核心基因找多因子分析。
同样，图很漂亮。

说到疾病，不能忘记下面这个疾病研究的经典思路。

四、Network&pathway
Integrated identification of key genes and pathways in Alzheimer’s disease via comprehensive bioinformatical analyses
(hereditas IF: 2.4)
这个是什么意思呢，就是筛选差异，做完降维之后，更多的放在富集分析上，多做些富集分析的内容，不往后走了。

五、CeRNA思路：多套数据整合
Systematic Characterization of Circular RNA-Associated CeRNA Network Identified Novel circRNABiomarkers in Alzheimer’s Disease
(Frontiers in Bioengineering and Biotechnology IF: 3.6)
这个不多说，跟多因子的思路差不多，不过由于ceRNA研究涉及到lcnRNA就得验证，所以人家作者挑战了高难度选择了circRNA，这样不验证的理由可以是数据少喽，轻松过关。
换句话说，做这个思路不管是数据多少，其实就是辛苦活了，堆了很多的数据。
The data analyzed in this study were obtained from the GSE5281, GSE1297, GSE12685 GSE16759。

六、基因诊断模型+WB验证
Identification of Blood Biomarkers for Alzheimer’s Disease Through Computational Prediction and Experimental Validation
(Frontiers in Neurology IF: 2.8)
寻找marker ，降维，构建模型来做诊断模型，这个很经典，但是很难找到合适的数据验证的时候，就得需要通过实验来验证了，这个思路也很不错。

有小伙伴问了，如果诊断数据不够，我又想做诊断模型，应该怎么做。
我建议你提高难度系数，做lncRNA的诊断模型，同时构建诊断模型的时候选择一些高级的模型构建方法，比如这一篇。

七、lncRNA诊断模型+SVM
Analysis of long noncoding RNAs highlights region-specific altered expression patterns and diagnostic roles in Alzheimer’s disease
( briefings in bioinformatics IF: 8.9)
通过整合芯片的原始数据，构建lncRNA的表达谱数据，然后筛选差异的lncRNA，构建基于lncRNA的诊断模型。差异的lncRNA+SVM，效果确实好啊。
相关阅读:
HTML5 History 模式 nginx配置
 nginx配置及性能调优
 windows启动jar包bat文件
 在线小工具
 BAT文件里Maven命令执行后退出的解决方案
 文字超出隐藏
 SOCKET.IO
call与apply简单介绍
 html里面，没有内容，要高度占满页面
 css实现三角形标
原文地址：https://www.cnblogs.com/leezx/p/13718267.html