直方图和柱状图因其长得很相似,故常引起初学者的疑惑,但其实二者存在很大的区别。
上述两图中,前图为柱状图,后图为直方图。单从视觉上看来两种图很相似,但是细心点也可以发现柱状图的图中是有间隔的,而直方图没有,但是为什么呢?他们又分别用于什么情况?
柱状图和直方图其实在本质上的功能就是不同的,柱状图常描述多个对象的某个值的不同,而直方图常描述同一个值在不同区间中的分布。听起来有点抽象,下面举个栗子。
比如对某地区PM2.5的采样,每小时采集一次,柱状图则将每小时的PM2.5的数值都各画成一个柱状条,每个条的高度表示该小时里PM2.5的值。而直方图则将所测得的PM2.5的值的分布进行划分,比如讲值分为(0,20],(20,40],(40,60],(60,80]…,然后将每个区间作为一个柱状条的横轴,其高度表示所测得数据中在该区间中出现的次数,比如PM2.5的值在(0,20]这个范围里出现了5次,则其高度就为5。
而在画图中,柱状图一般记为为bar,直方图则记为hist