• (转)转录组福音 | 基于表达谱研究疾病七大思路汇总


    收藏|基于表达谱研究疾病七大思路汇总 - 生信人

    IF:9|全新的疾病特征基因筛选策略 - 生信人

    昨天我们推广的疾病的分析思路,火爆网络,索性今天再来一个返场小段,供大家消遣一下。
    因为大部分的疾病不致死,或者说预后部分的信息收集并不全面,所以在做生信分析的时候跟肿瘤相比,就缺了最重要的一步预后效果验证如何。
    我们之前说过肿瘤筛选marker有三大步骤,差异,降维,预后。
    但是对于疾病来说没有了预后,文章思路就不完整了。
    小编今天通过对AD研究的几篇文章来简单介绍下如果没有预后,我们如何研究,如何分析。

    1、核心基因+多因子(6+)
    2、WGCNA+多样本验证(3+)
    3、WGCNA+多因子(1.9)
    4、Network&pathway(2.4)
    5、CeRNA思路:多套数据整合(3.6)
    6、基因诊断模型+WB验证(2.8)
    7、lncRNA诊断模型+SVM(8.9)

    有生信分析需求
    请扫码添加微信
    获取更多疾病相关思路

    一、核心基因+多因子
    Identification of molecular signatures and pathways to identify novel therapeutic targets in Alzheimer's disease: Insights from a systems biomedicine perspective
    (Genomics IF: 6+)
    核心基因是公号去年推广的一个免费视频,简单说来就是GEO数据筛选差异,通过网络降维,然后TCGA预后验证。但是如果对于疾病没有了预后,通常我们会增加TF、miRNA、Drug等因子的研究,筛序到核心的基因,再拓展下相关的因子、药物等等。

    二、WGCNA+多样本表达验证
    Identification of KIAA0513 and Other Hub Genes Associated With Alzheimer Disease Using Weighted Gene Coexpression Network Analysis
    (Froniter in genetics IF: 3+)
    这篇文章研究的是颞叶皮层AD样本的WGCNA分析,筛选到核心模块和基因之后,还是缺点东西,所以作者选择了去用其他的组织样本进行表达验证,甚至用了老鼠的样本。
    同时,作者深知分析内容不够,生信来凑的实际情况,于是这篇文章的图,超级精美。


    看到这有小伙伴就说了,难道不能WGCNA筛选降维之后,看看多因子么,当然可以。

    三、WGCNA+多因子
    Screening and Identification of Potential Peripheral Blood Biomarkers for Alzheimer’s Disease Based on Bioinformatics Analysis
    (medical science monitor IF: 1.9+)
    还记得小编说过的吧,要保证思路、分析、数据至少有一个不一样。
    这篇文章也是WGCNA,虽然后面成了多因子,但是呢如果样本也都一样,还是有作弊的嫌疑。
    但是呢,作者很厉害,选择的是PBMC的数据。
    分析内容为筛选差异,WGCNA筛选核心基因和模块,富集分析,然后针对核心基因找多因子分析。
    同样,图很漂亮。


    说到疾病,不能忘记下面这个疾病研究的经典思路。

    四、Network&pathway
    Integrated identification of key genes and pathways in Alzheimer’s disease via comprehensive bioinformatical analyses
    (hereditas IF: 2.4)
    这个是什么意思呢,就是筛选差异,做完降维之后,更多的放在富集分析上,多做些富集分析的内容,不往后走了。


    五、CeRNA思路:多套数据整合
    Systematic Characterization of Circular RNA-Associated CeRNA Network Identified Novel circRNABiomarkers in Alzheimer’s Disease
    (Frontiers in Bioengineering and Biotechnology IF: 3.6)
    这个不多说,跟多因子的思路差不多,不过由于ceRNA研究涉及到lcnRNA就得验证,所以人家作者挑战了高难度选择了circRNA,这样不验证的理由可以是数据少喽,轻松过关。
    换句话说,做这个思路不管是数据多少,其实就是辛苦活了,堆了很多的数据。
    The data analyzed in this study were obtained from the GSE5281, GSE1297, GSE12685 GSE16759。


    六、基因诊断模型+WB验证
    Identification of Blood Biomarkers for Alzheimer’s Disease Through Computational Prediction and Experimental Validation
    (Frontiers in Neurology IF: 2.8)
    寻找marker ,降维,构建模型来做诊断模型,这个很经典,但是很难找到合适的数据验证的时候,就得需要通过实验来验证了,这个思路也很不错。

    有小伙伴问了,如果诊断数据不够,我又想做诊断模型,应该怎么做。
    我建议你提高难度系数,做lncRNA的诊断模型,同时构建诊断模型的时候选择一些高级的模型构建方法,比如这一篇。

    七、lncRNA诊断模型+SVM
    Analysis of long noncoding RNAs highlights region-specific altered expression patterns and diagnostic roles in Alzheimer’s disease
    ( briefings in bioinformatics IF: 8.9)
    通过整合芯片的原始数据,构建lncRNA的表达谱数据,然后筛选差异的lncRNA,构建基于lncRNA的诊断模型。差异的lncRNA+SVM,效果确实好啊。

  • 相关阅读:
    HTML5 History 模式 nginx配置
    nginx配置及性能调优
    windows启动jar包bat文件
    在线小工具
    BAT文件里Maven命令执行后退出的解决方案
    文字超出隐藏
    SOCKET.IO
    call与apply简单介绍
    html里面,没有内容,要高度占满页面
    css实现三角形标
  • 原文地址:https://www.cnblogs.com/leezx/p/13718267.html
Copyright © 2020-2023  润新知