ggplot2提供了两个画图函数用于绘制频数分布图:geom_histogram()和geom_bar()
1.离散变量
对于离散变量的频数分布图,只需要输入离散变量数据就可以。
> a [1] 1 1 1 2 2 3
> x_break=seq(0,3,by=1) > ggplot(NULL,aes(x=a))+geom_histogram(fill="white",colour="black",binwidth=1)+scale_x_continuous(breaks=x_break) #geom_histogram的stat参数默认为“bin”,会自动计算每组对应的观察数。 #binwidth是组距,默认为30。 #fill是直方图的填充颜色 #colour是直方图的边框颜色
2.连续变量
对于连续数据的频数分布图,要考虑组距的大小,还有第一个组的起始位点。
组距大小:binwidth
第一个组的起始位点:origin
> b=c(1.1,1.2,1.3,2.1,2.2,3.2)
> x_break=seq(0,3,by=1) > ggplot(NULL,aes(x=b))+geom_histogram(fill="white",colour="black",binwidth=1,origin=0)+scale_x_continuous(breaks=x_break) #origin是第一个组距的起始值