转录组紧紧围绕基因表达量和功能分析两部分,结合生物学问题来进行数据分析。
-
高表达基因已经研究比较透彻,应该更多关注中低表达基因。
-
层次聚类的妙用:
-- 全部基因——>(差异分析)——>根据趋势挑选部分特异性基因——>功能分析;
-- 功能大类聚类——>根据趋势挑选部分特异性功能——>功能小类聚类;
-- 通路表达量的计算:该通路全部基因表达量之和除以该通路基因数; -
趋势分析(cmeans聚类)阐释不了太多生物学问题,比较适合筛选特异性基因,如标志物筛选。
-
功能富集分析不应过多关注显著P值,功能通路作为一个整体,不应排除差异非显著的基因作用。
-
根据功能来推测生物学过程,需要经验,如胞外信号呈递通路发生变化,可能受外界刺激。
-
网络构建不要过多关注高表达或差异基因,更多关注hub基因,验证也是如此。
-
网络分析和功能分析是分开的两条路,网络更多是标志物筛选,不解释生物学问题;功能作为整体研究来描述生物问题。
来源讲座:胡松年,转录组数据分析思路