• pathway对高通量数据分析的重要性


    在听老师将Wnt通路时,有下面的体悟:Wnt通路中,APC结合GSK3和CK1后,招募β-catenin,使β-catenin磷酸化,继而泛素化,β-catenin蛋白降解。整个过程是动态平衡的。

    但是,如果APC发生变异,APC不能与GSK3和CK1结合,那么β-catenin不能被招募,不能被降解。然后,β-catenin会入核,与TCF、LEF1转录因子结合,启动基因转录,改变基因表达。继而影响生物学功能。

    那么,在分析高通量测序数据(DNA/RNA测序数据)时,如果发现了成百上千个基因突变或差异表达的基因,如何下手找生物学意义呢?

    我们可以结合疾病特点,从疾病特异的pathway入手。如:从上面这些基因入手。

    或者,我们已经发现了APC的变异,后续怎么做呢?找基因TCF、LEF1、GSK3、CK1等基因的变异,看看这些基因是否有变异。

    一方面,这又产生一个问题:这样的数据分析得到的结果,永远是已知的知识。科学研究,更多的是想得到未知的规律,而不是验证已知的规律。如何从数据分析中发现未知的规律呢?

    这就还是回到了老本行:找出差异基因富集的通路和生物学过程。富集结果有可能与预期一致,有可能不一致。如果不一致,去实验验证这些富集结果。验证OK,新发现;验证NG,数据有问题。

    高通量数据分析的意义有两个方面:

    1.在大数据上验证某个已报道的现象;

    2.发现未知的规律,解释未知的现象。

    另一方面:

    这就是数据分析人员需要与实验人员沟通的所在。他们看到APC的变异会马上想知道这些相互作用的基因TCF、LEF1、GSK3、CK1是否有变异,是否表达有差异。而,数据分析人员,只想着将有差异的基因筛选出来,借助数据库将他们放到一个可解释的生物过程(pathway、GO过程等)中。这样一来,数据分析人员就忽略了那些变异不明显但生物学意义重大的生物过程。

    如何解决这个问题呢?

  • 相关阅读:
    【bzoj4399】魔法少女LJJ 并查集+权值线段树合并
    【bzoj4059】[Cerc2012]Non-boring sequences 分治
    【bzoj4390】[Usaco2015 dec]Max Flow LCA
    【bzoj4127】Abs 树链剖分+线段树
    【bzoj1222】[HNOI2001]产品加工 背包dp
    【bzoj4966】总统选举 随机化+线段树
    protected internal == internal
    框架的一点小随笔
    WPF 的 数据源属性 和 数据源
    Python 运算符重载
  • 原文地址:https://www.cnblogs.com/zypiner/p/11738683.html
Copyright © 2020-2023  润新知