pathway对高通量数据分析的重要性

pathway对高通量数据分析的重要性

在听老师将Wnt通路时，有下面的体悟：Wnt通路中，APC结合GSK3和CK1后，招募β-catenin，使β-catenin磷酸化，继而泛素化，β-catenin蛋白降解。整个过程是动态平衡的。

但是，如果APC发生变异，APC不能与GSK3和CK1结合，那么β-catenin不能被招募，不能被降解。然后，β-catenin会入核，与TCF、LEF1转录因子结合，启动基因转录，改变基因表达。继而影响生物学功能。

那么，在分析高通量测序数据（DNA/RNA测序数据）时，如果发现了成百上千个基因突变或差异表达的基因，如何下手找生物学意义呢？

我们可以结合疾病特点，从疾病特异的pathway入手。如：从上面这些基因入手。

或者，我们已经发现了APC的变异，后续怎么做呢？找基因TCF、LEF1、GSK3、CK1等基因的变异，看看这些基因是否有变异。

一方面，这又产生一个问题：这样的数据分析得到的结果，永远是已知的知识。科学研究，更多的是想得到未知的规律，而不是验证已知的规律。如何从数据分析中发现未知的规律呢？

这就还是回到了老本行：找出差异基因富集的通路和生物学过程。富集结果有可能与预期一致，有可能不一致。如果不一致，去实验验证这些富集结果。验证OK，新发现；验证NG，数据有问题。

高通量数据分析的意义有两个方面：

1.在大数据上验证某个已报道的现象；

2.发现未知的规律，解释未知的现象。

另一方面：

这就是数据分析人员需要与实验人员沟通的所在。他们看到APC的变异会马上想知道这些相互作用的基因TCF、LEF1、GSK3、CK1是否有变异，是否表达有差异。而，数据分析人员，只想着将有差异的基因筛选出来，借助数据库将他们放到一个可解释的生物过程（pathway、GO过程等）中。这样一来，数据分析人员就忽略了那些变异不明显但生物学意义重大的生物过程。

如何解决这个问题呢？
相关阅读:
待思考问题---数据库的分层模型
 iOS的常用类库
 java spring是元编程框架---使用的机制是注解+配置
 Java Virtual Machine (JVM), Difference JDK, JRE & JVM – Core Java
Spring注解的使用和组件扫描
 Spring Boot实战：拦截器与过滤器
 问题、存在与认知---问题产生的原因是对存在的不完全或错误认知
 元编程的分层模型
 元编程的本质---高级语言的表达通过解释生成低级语言的表达（代码）
aop分层模型——aop是元编程的一种
原文地址：https://www.cnblogs.com/zypiner/p/11738683.html