想要拔高生信paper level的必备分析
没有吃透这些工具,那作为生信人是不合格的!
类似打球的肌肉记忆,生信分析也需要“肌肉记忆”,这就是对各种工具的熟练掌握,这样才能把精力放在重要问题的思考和推理上。
收集总结各种精华工具,做好代码测试和工具测评,有条件可以封装代码形成自己的函数,下次使用时即可一行代码调用,形成自己的“肌肉记忆”。
这里只作目录收集总览,具体测试代码会开单独的技术型文章,深入细节。
ORA
普通的基因集富集,不想多说,必做。
GSEA
教程:Gene Set Enrichment Analysis (GSEA) User Guide - 官方
我之前的文章:
GSEA - Gene set enrichment analysis 基因集富集 | ORA - Over-Representation Analysis 分析原理与应用
之前做GSEA分析都是用的clusterProfiler,它会使用现成的工具如fgsea,但这些工具已经过时太久了,现在有个GSEABase,可以替代。
新开一篇测试细节文章:GSEABase做富集分析
关于MSigDB的介绍 - MSigDB:GSEA提供的基因集数据库
变种
- DGSEA
- ssGSEA (单样本escape整合)
TF
必不可少,调控的核心。
主要工具:
- SCENIC
- 手动TF target分析
- Cistrome
PPI
蛋白互作,跟调控擦边了,不局限与TF。
主要工具:
- GENEMANIA
- STRING
WGCNA
基因模块分析,数据特异性的结果
CCI
细胞通讯,细胞层面的调控。
主要工具:
- CytoTalk
- CellChat
参考:
Sci Adv|谭凯/高琳团队合作开发细胞间通讯分析新算法,从头构建细胞类型特异性信号转导网络
inferCNV
重点应用在肿瘤癌症领域
待测试:
- GenePattern
- GSVA
统计
什么情况该用什么统计检验?
benchmark
A multicenter study benchmarking single-cell RNA sequencing technologies using reference samples - NBT - 2020