• R语言学习


    首先把测试数据存储到文件中方便调用。数据矩阵存储在line_data.xls和line_data_melt.xls文件中 (直接拷贝到文件中也可以,这里这么操作只是为了随文章提供个测试文件,方便使用。如果你手上有自己的数据,也可以拿来用)。
    profile = "Pos;H3K27ac;CTCF;Enhancer;H3K4me3;polII
    -5000;8.7;10.7;11.7;10;8.3
    -4000;8.4;10.8;11.8;9.8;7.8
    -3000;8.3;10.5;12.2;9.4;7
    -2000;7.2;10.9;12.7;8.4;4.8
    -1000;3.6;8.5;12.8;4.8;1.3
    0;3.6;8.5;13.4;5.2;1.5
    1000;7.1;10.9;12.4;8.1;4.9
    2000;8.2;10.7;12.4;9.5;7.7
    3000;8.4;10.4;12;9.8;7.9
    4000;8.5;10.6;11.7;9.7;8.2
    5000;8.5;10.6;11.7;10;8.2"
     
    profile_text <- read.table(text=profile, header=T, row.names=1, quote="",sep=";")
    # tab键分割,每列不加引号
    write.table(profile_text, file="line_data.xls", sep="	", row.names=T, col.names=T,quote=F)
    # 如果看着第一行少了ID列不爽,可以填补下
    system("sed -i '1 s/^/ID	/' line_data.xls")
    
    profile = "Pos;variable;value;set
    -5000;H3K27ac;8.71298;A
    -4000;H3K27ac;8.43246;A
    -3000;H3K27ac;8.25497;A
    -2000;H3K27ac;7.16265;A
    -1000;H3K27ac;3.55341;A
    0;H3K27ac;3.5503;A
    1000;H3K27ac;7.07502;A
    2000;H3K27ac;8.24328;A
    3000;H3K27ac;8.43869;A
    4000;H3K27ac;8.48877;A
    -5000;CTCF;10.6913;A
    -4000;CTCF;10.7668;A
    -3000;CTCF;10.5441;A
    -2000;CTCF;10.8635;A
    -1000;CTCF;8.45751;A
    0;CTCF;8.50316;A
    1000;CTCF;10.9143;A
    2000;CTCF;10.7022;A
    3000;CTCF;10.4101;A
    4000;CTCF;10.5757;A
    -5000;H3K27ac;8.71298;B
    -4000;H3K27ac;8.43246;B
    -3000;H3K27ac;8.25497;B
    -2000;H3K27ac;7.16265;B
    -1000;H3K27ac;3.55341;B
    0;H3K27ac;3.5503;B
    1000;H3K27ac;7.07502;B
    2000;H3K27ac;8.24328;B
    3000;H3K27ac;8.43869;B
    4000;H3K27ac;8.48877;B
    -5000;CTCF;10.6913;B
    -4000;CTCF;10.7668;B
    -3000;CTCF;10.5441;B
    -2000;CTCF;10.8635;B
    -1000;CTCF;8.45751;B
    0;CTCF;8.50316;B
    1000;CTCF;10.9143;B
    2000;CTCF;10.7022;B
    3000;CTCF;10.4101;B
    4000;CTCF;10.5757;B"
     
    profile_text <- read.table(text=profile, header=T, quote="",sep=";")
    # tab键分割,每列不加引号
    write.table(profile_text, file="line_data_melt.xls", sep="	", row.names=T, col.names=T,quote=F)
    # 如果看着第一行少了ID列不爽,可以填补下
    system("sed -i '1 s/^/ID	/' line_data_melt.xls")

    使用正常矩阵默认参数绘制个线图

    # -f: 指定输入的矩阵文件,第一列为行名字,第一行为header。列数不限,列名字不限;行数不限,行名字默认为文本
    # -A FALSE: 指定行名为数字
    sp_lines.sh -f line_data.xls -A FALSE
    # -l: 设定图例的顺序
    # -o TRUE: 局部拟合获得平滑曲线
    # -A FALSE: 指定行名为数字
    # -P: 设置legend位置,相对于原点的坐标
    # -x, -y指定横纵轴标记
    sp_lines.sh -f line_data.xls -l "'CTCF','Enhancer','polII','H3K4me3','H3K27ac'" -P 'c(0.8,0.3)' -o TRUE -A FALSE -x 'Up and down 5 kb of TSS' -y 'Relative density'
    # -A FALSE: 指定行名为数字
    # -V 'c(-1000, 500)': 设置垂线的位置
    # -D: 设置垂线的文本标记,参数为引号引起来的vector,注意引号的嵌套
    # -I: 设置横轴的标记的位置
    # -b: 设置横轴标记的文字
    sp_lines.sh -f line_data.xls -A FALSE -V 'c(-1000,500)' -D "c('+1 kb','-0.5 kb')" -I "c(-5000,0,5000)" -b "c('-5 kb', 'TSS', '+5 kb')"
    使用melted矩阵默认参数绘制个线图 (除需要改变文件格式,指定-m TRUE -a xvariable外其它与正常矩阵一样)
    # -f: 指定输入文件
    # -m TRUE: 指定输入的矩阵为melted format, 三列,第一列为Pos (给-a)
    # 第二列为variable (给-H,-H默认即为variable)
    # 第三列为value,名字不可修改
    # -A FALSE: 指定行名为数字
    # -P 'c(0.8,0.2)': 设置legend位置,相对于原点的坐标
    sp_lines.sh -f line_data_melt.xls -a Pos -m TRUE -A FALSE -P 'c(0.8,0.2)'
    完整的图
    # -C: 自定义线的颜色
    sp_lines.sh -f line_data_melt.xls -a Pos -m TRUE -A FALSE -P 'c(0.8,0.2)' -o TRUE -V 'c(-1000,500)' -D "c('+1 kb','-0.5 kb')" -I "c(-5000,0,4000)" -b "c('-5 kb', 'TSS', '+4 kb')" -x 'Up 5 kb and down 4 kb of TSS' -y 'Relative density' -C "'pink', 'blue'"
    数中最需要注意的是引号的使用:
    • 外层引号与内层引号不能相同
    • 凡参数值中包括了空格,括号,逗号等都用引号括起来作为一个整体
  • 相关阅读:
    Objective-C Memory Management Being Exceptional 异常处理与内存
    Objective-C Memory Management 内存管理 2
    c语言全局变量与局部变量(当变量重名时)的使用情况
    c语言指针字符串与字符数组字符串的区别
    c语言数组不同初始化方式的结果
    补码的用途
    struts2框架加载配置文件的顺序
    CSS盒子模型
    基于注解整合struts2与spring的时候如果不引入struts2-spring-plugin包自动装配无效
    @Resource注解省略name属性后的行为
  • 原文地址:https://www.cnblogs.com/freescience/p/7454686.html
Copyright © 2020-2023  润新知