中位数
中位数(Median)又称中值,统计学中的专有名词,是按顺序排列的一组数据中居于中间位置的数,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分。对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。
定义
中位数,又称中点数,中值。中位数是按顺序排列的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比他大,有一半的数据比他小,这里用 来表示中位数。(注意:中位数和众数不同,众数指最多的数,众数有时不止一个,而中位数只能有一个。)
有一组数据:
将它按从小到大的顺序排序为:
则当N为奇数时
当N为偶数时,
一个数集中最多有一半的数值小于中位数,也最多有一半的数值大于中位数。如果大于和小于中位数的数值个数均少于一半,那么数集中必有若干值等同于中位数。
设连续随机变量X的分布函数为 ,那么满足条件 的数称为X或分布F的中位数。
特点
- 中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性。
- 有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。
- 趋于一组有序数据的中间位置
计算示例
对于一组有限个数的数据来说,它们的中位数是这样的一种数:这群数据里的一半的数据比它大,而另外一半数据比它小。 计算有限个数的数据的中位数的方法是:把所有的同类数据按照大小的顺序排列。如果数据的个数是奇数,则中间那个数据就是这群数据的中位数;如果数据的个数是偶数,则中间那2个数据的算术平均值就是这群数据的中位数。
中位数:也就是选取中间的数,是一种衡量集中趋势的方法。
例1
找出这组数据:23、29、20、32、23、21、33、25 的中位数。
解:
首先将该组数据进行排列(这里按从小到大的顺序),得到:
20、21、23、23、25、29、32、33
因为该组数据一共由8个数据组成,即n为偶数,故按中位数的计算方法,得到 中位数
,即第四个数和第五个数的平均数。
例2
找出这组数据:10、20、 20、 20、 30的中位数。
解:
首先将该组数据进行排列(这里按从小到大的顺序),得到:
10、 20、 20、 20、 30
因为该组数据一共由5个数据组成,即n为奇数,故按中位数的计算方法,得到中位数为20,即第3个数。
区别联系
- 平均数是通过计算得到的,因此它会因每一个数据的变化而变化。
- 中位数是通过排序得到的,它不受最大、最小两个极端数值的影响。部分数据的变动对中位数没有影响,当一组数据中的个别数据变动较大时,常用它来描述这组数据的集中趋势。
- 众数也是数据的一种代表数,反映了一组数据的集中程度.日常生活中诸如“最佳”、“最受欢迎”、“最满意”等,都与众数有关系,它反映了一种最普遍的倾向。
优缺点:
平均数:需要全组所有数据来计算;易受数据中极端数值的影响。中位数:仅需把数据按顺序排列后即可确定;不易受数据中极端数值的影响。众数:通过计数得到;不易受数据中极端数值的影响。