第1集 均值mean 中位数median 众数mode
均值(mean)也就是算术平均值,即数据集中所有数据之和除以数据个数。
中位数(median, middle number)是数据集排序后,处在中间的数。
众数(mode)是数据集中出现次数最多的数。
第2集 极差range 中程数midrange
极差(range)是数据集中最大数减去最小数的统计量。
中程数(midrange)是最大数和最小数的均值。
极差:指的是数据集中数字分开的有多远
极差计算:数据集中最大的数 - 数据集中最小的数
极差意义:极差数值越小,数字之间就越紧密
中程数:最大数和最小数的平均值(算术平均值)
中程数意义:衡量数据的集中趋势
第3集 象形统计图 pictograph
象形统计图是用象形图像表示统计数据的图像,这一节讲象形统计图及例子。
第4集 条形图 bar graph
条形图又称柱形图,是一种重要的分类汇总工具,这一节讲条形图及例子。
第5集 线形图 line graph
线形图,是将数据点描出来,然后连线形成的图像。用来表示趋势,这一节讲线形图及例子。
第6集 饼图 pie graph
饼图,看起来像一块切开的饼,用于表示占比。这一节讲饼图及例子。
第7集 误导人的线形图 Misleading line graphs
下图主要误导人的地方有两点:
1. 左右两图的刻度不同,左图的起始刻度是50%,而右图起始刻度是0%,给人感觉像是喜欢Thrill Soda的人超过了Yummy Cola的人,实际上即使喜欢Yummy Cola的人在减少,喜欢Yummy Cola的人远多于喜欢Thrill Soda的人。
2. 左图和右图刻度距离不同,即右图10%的刻度距离差不多是左图10%距离的1.5倍,导致右图看起来上升幅度更大。
应该将两条折线放在一张图里面更准确、更真实。
第8集 茎叶图 stem and leaf plot
茎叶图是将数组中的数按位数进行比较,分别做出茎和叶,以此统计数据。这一讲讲茎叶图及例子。
第9集 箱线图 Box plot
盒须图是用四个四分位点分开数据集的图,能有效给出数据散布状况。这一讲讲盒须图及例子。
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的最大值、最小值、中位数和两个四分位数;然后, 连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间。
下图中位数是6,下四分位数是2.5,上四分位数是12.5,最小值是1,最大值是22
这组数据显示出:
- 最小值(minimum)=5
- 下四分位数(Q1)=7
- 中位数(Med--也就是Q2)=8.5
- 上四分位数(Q3)=9
- 最大值(maximum)=10
- 平均值=8
- 四分位间距(interquartile range)={displaystyle Q3-Q1}=2 (即ΔQ)
第10集 箱线图2
这一讲讲盒须图的另外一个例子,强化盒须图这一重要统计图表的概念。