scRNA-seq做完该做的QC、normalization、imputation、clustering、trajectory和integration,就会开始做转录调控的分析了。
核心就是围绕着TF转录因子做文章
- 预测TF的靶基因
- 鉴定regulon
大部分都是高通量的预测,准确性有待论证,需要很好的实验验证设计。
预测的工具不要太多:
MARINa — Andrea Califano - paper
这是一个高通量测序后发明的词,其实就是被同一个调控元件(常见的就是TF)调控的一群基因的集合。
In molecular genetics, a regulon is a group of genes that are regulated as a unit, generally controlled by the same regulatory gene that expresses a protein acting as a repressor or activator.
我们可以从转录调控中看到造物主的影子。
看似简单,就一个中心法则,其实非常复杂,有很多细节。
Transcriptional Regulation and Its Misregulation in Disease 这篇综述必读,但凡是做转录调控的。
基本问题:
分子生物学是如何定义转录调控的?
RNA-seq是如何测出我们基因的表达量的?
基因的表达量与蛋白和代谢的产生量同步吗?
真实的基因表达,半衰期?
我们常规的DEG、GO里到底包含了多少有用的信息?基于不准信息的结果能准确吗?
我们都陷入困境,我们观测了太多的细节,却拼不出一副草图。人类基因组确实一大突破,但却是最简单的突破,天书是有了,怎么解读才是真正费脑的事。
生命科学是观测型科学,一切都是基于观察的,不管是实验还是生信,都是在观察,没有观察就没有知识,很难仅仅通过推理产生新的知识。
基因表达调控包括转录水平、转录后水平和翻译水平。
转录调控是指通过改变转录速率从而改变基因表达的水平,其对遗传信息的传递的准确性和多样性具有重要的作用。真核生物的转录调控包括多种形式,例如DNA甲基化、组蛋白修饰、染色质重塑、转录因子等。
真核生物基因转录在细胞核内进行,而翻译则在细胞质中进行,因此转录后调控是基因表达调控的另一个重要方面,主要包括RNA可变剪接、RNA甲基化以及多种调控RNA(miRNA、lncRNA、circRNA)参与的转录后调控等。
尽管在真核生物中,基因调控主要发生在转录水平,但有些对细胞生存十分重要的蛋白质的合成,其调控也发生在翻译水平。这其中最为重要的几个方面是:mRNA的稳定性,翻译起始调节,翻译相关因子中起始因子的作用以及真核mRNA的结构等。
DNA甲基化:DNA甲基化(英语:DNA methylation)为DNA化学修饰的一种形式,能在不改变DNA序列的前提下,改变遗传表现。DNA甲基化过程会使甲基添加到DNA分子上,例如在胞嘧啶环的5'碳上:这种5'方向的DNA甲基化方式可见于所有脊椎动物。特定胞嘧碇受甲基化的情形,可利用亚硫酸盐定序(bisulfite sequencing)方式测定。DNA甲基化可能使基因沉默化,进而使其失去功能。
组蛋白修饰:组蛋白是与DNA结合的蛋白,它们会对基因的表达产生影响。组蛋白在相关酶作用下发生甲基化、乙酰化、磷酸化、腺苷酸化、泛素化、ADP核糖基化等修饰的过程。
染色质重塑:染色质重塑chromatin remodeling :基因表达的复制和重组等过程中,染色质的包装状态、核小体中组蛋白以及对应DNA分子会发生改变的分子机理。
转录因子:转录因子是与DNA特异性结合的一系列蛋白质。结合在DNA上的启动子以及增强子之类控制转录的区域上,促进或者抑制DNA上的遗传信息向RNA转录的过程。转录因子的这一机能可以单独,或者通过与其它蛋白质形成复合体来完成。人类的基因组上已经推定出大约1800个基因控制转录因子的编码。
转录调控太复杂了,但它确实真实存在的,单细胞的基因表达就是由转录调控综合决定的。
现在比较好入手的就是研究转录因子、可变剪切和lncRNA了。
能不能开发一个工具来挖掘这些调控信息,现在的基因表达数据的利用率太低了。
研究转录调控我想知道什么?
1. 在发育过程中,哪些核心的调控因子在调控着发育过程?
2. 在致病过程中,哪些核心的调控因子的失调导致了疾病?
基于pathway or genelist的NN模式识别,或者预测。
lncRNA与single cell的挖掘
到底是哪些因素在控制基因的表达调控
能不能开发出超越聚类的单细胞分析方法?
我的数据到底可以研究什么,不能研究什么?
组织、器官都是由单细胞组成的,单细胞内某一刻的基因表达是转录调控的结果,现在我们想知道生物体内的转录调控在发育和致病过程中是如何自发进行的!!!
trigger
https://github.com/slowkow/tftargets
human transcription factor download
transcription factor single cell
lncRNA target gene