接R语言笔记3--实例1
R语言中的可视化函数分为两大类,探索性可视化(陌生数据集,不了解,需要探索里面的信息;偏重于快速,方便的工具)和解释性可视化(完全了解数据集,里面的故事需要讲解别人;偏重全面,美观的工具)。
R语言中的绘图包:
graphics(自带) >探索性
lattice >探索性
ggplot2 >解释性
1、对x1进行直方图分析,绘制直方图hist()
2、探索各科成绩的关联关系,散点图绘制函数plot()
3、列联表分析,列联函数table(),柱状图绘制函数barplot()
4、连线图
type="l":l的意思是line
5、密度图
6、饼图,饼图绘制函数pie()
7、箱尾图
箱子的上下横线为样本的25%和75%分位数
箱子中间的横线为样本的中位数
上下延伸的直线为尾线,尾线的尽头为最高值和最低值
异常值
8、箱线图
9、相图
每个观测单位的数值表示为一个图形
每个图的每个角表示一个变量,字符串类型会标注在图的下方
角线的长度表达值的大小
注释:下图是10*10的,100为同学,每位同学都有三科成绩,则表示每位同学都有一个星相图形,大的,端正的表示成绩好
10、脸谱图
安装aplpack包
>library(aplpack)
其它脸谱图
安装TeachingDemos包
11、茎叶图
一个63,一个66,两个67,一个68...
12、QQ图
可用于判断是否正态分布
直线的斜率是标准差,截距是均值
点的散布越接近直线,则越接近正态分布
13、R内置数据集
函数data()列出内置数据集
14、热力图
利用内置的mtcars数据集绘制
先将mtcars数据框转换为矩阵才能进行
15、高级散点图
(1)向日葵散点图
用来克服散点图中数据点重叠问题
在有重叠的地方用一朵“向日葵花”的花瓣数目来表示重叠数据的个数
(2)散点图集
遍历样本中全部的变量配对画出二元图
直观地了解所有变量之间的关系
用plot也可以实现同样的效果
利用par()在同一个device输出多个散点图
par命令博大精深,用于设置绘图参数,help(par)
(3)三维散点图
安装scatterplot3d包(放在R语言的安装位置的library目录下)
16、调和曲线图
unison.r的代码(脚本)
自定义函数
调和曲线用于聚类判断非常方便
>source("d:\unison.R")
>unison(x[2:4])
17、地图
安装maps包
>library(maps)
>map("state",interior=FALSE)
>map("state",boundary=FALSE,col="red",add=TRUE)
>map("world",fill=TRUE,col=heat.colors(10))
>