• pheatmap, gplots heatmap.2和ggplot2 geom_tile实现数据聚类和热图plot


    主要步骤

    pheatmap

    • 数据处理成矩阵形式,给行名列名
    • 用pheatmap画热图(pheatmap函数内部用hclustfun 进行聚类)

    ggplot2

    • 数据处理成矩阵形式,给行名列名
    • hclust聚类,改变矩阵行列顺序为聚类后的顺序
    • melt数据,处理成ggplot2能够直接处理的数据结构,并加上列名
    • ggplot_tile进行画图

    gplots

    • 数据处理成矩阵形式,给行名列名
    • 调制颜色并用heatmap.2画热图(heatmap.2函数内部用hclustfun 进行聚类)

    R语言代码

    library(pheatmap)
    library(data.table)
    CN_DT <- fread("/home/ywliao/project/Gengyan/ONCOCNV_result/ONCOCNV_all_result.txt",sep="	")
    dt <- CN_DT[cfDNATime=="cfDNA1"]
    wdt <- dcast(dt,Gene~Sample,value.var = "CN",fun.aggregate = mean)
    data <- as.matrix(wdt[,2:length(wdt),with=F])  #数据矩阵
    rownames(data) <- unlist(wdt[,1]) 
    
    pheatmap(data)
    
    
    library(ggplot2) 
    library(data.table)
    CN_DT <- fread("/home/ywliao/project/Gengyan/ONCOCNV_result/ONCOCNV_all_result.txt",sep="	")
    dt <- CN_DT[cfDNATime=="cfDNA1"]
    wdt <- dcast(dt,Gene~Sample,value.var = "CN",fun.aggregate = mean)
    data <- as.matrix(wdt[,2:length(wdt),with=F])  #数据矩阵
    rownames(data) <- unlist(wdt[,1]) 
    
    hc<-hclust(dist(data),method = "average") #对行进行聚类
    rowInd<-hc$order #将聚类后行的顺序存为rowInd
    hc<-hclust(dist(t(data)),method = "average")  #对矩阵进行转置,对原本的列进行聚类
    colInd<-hc$order  #将聚类后列的顺序存为colInd
    data<-data[rowInd,colInd] #将数据按照聚类结果重排行和列
    dp=melt(data)    #对数据进行融合,适应ggplot的数据结构,以进行热图的绘制
    colnames(dp) <- c("Gene","Sample","Value")
    p <- ggplot(dp, aes(Sample,Gene)) + geom_tile(aes(fill = as.factor(Value)))+theme(axis.text.x=element_text(angle = 90))+ guides(fill = guide_legend(title = "Copy Number")) + scale_fill_brewer(palette = 3)
    p
    
    


    library(gplots)
    library(data.table)
    CN_DT <- fread("/home/ywliao/project/Gengyan/ONCOCNV_result/ONCOCNV_all_result.txt",sep="	")
    dt <- CN_DT[cfDNATime=="cfDNA1"]
    wdt <- dcast(dt,Gene~Sample,value.var = "CN",fun.aggregate = mean)
    dp <- as.matrix(wdt[,2:length(wdt),with=F])  #数据矩阵
    
    labrow <- unlist(wdt[,1,with=F]) #行名
    colorsChoice<- colorRampPalette(c("green","black","red"))  #调制颜色
    
    heatmap.2(dp,labRow = labrow,col=colorsChoice(5),breaks = c(1,1.5,2,2.5,3,4),density.info="histogram",
              hclustfun = function(c)hclust(c,method="average"),keysize = 1.5, cexRow=0.5,trace = "none");
    
    

  • 相关阅读:
    docker数据卷
    docker容器的启动、停止、运行、导入、导出、删除
    docker镜像的获取、创建、修改、删除、导入操作
    docker使用-spark安装
    python爬虫-3 解析库
    python爬虫-2 requests使用
    NLP-HMM
    NLP-中文分词-预处理
    python爬虫-1环境安装
    学习笔记3
  • 原文地址:https://www.cnblogs.com/ywliao/p/7061418.html
Copyright © 2020-2023  润新知