• 可汗学院公开课统计学笔记 第1到10集 均值 中位数 众数 极差 统计图


     
     

    第1集 均值mean 中位数median 众数mode

    均值(mean)也就是算术平均值,即数据集中所有数据之和除以数据个数。
    中位数(median, middle number)是数据集排序后,处在中间的数。
    众数(mode)是数据集中出现次数最多的数。
     

    第2集 极差range 中程数midrange

    极差(range)是数据集中最大数减去最小数的统计量。
    中程数(midrange)是最大数和最小数的均值。
     
    极差:指的是数据集中数字分开的有多远
    极差计算:数据集中最大的数 - 数据集中最小的数
    极差意义:极差数值越小,数字之间就越紧密
     
    中程数:最大数和最小数的平均值(算术平均值)
    中程数意义:衡量数据的集中趋势
     

    第3集 象形统计图 pictograph

    象形统计图是用象形图像表示统计数据的图像,这一节讲象形统计图及例子。

    第4集 条形图 bar graph

    条形图又称柱形图,是一种重要的分类汇总工具,这一节讲条形图及例子。

    第5集 线形图 line graph

    线形图,是将数据点描出来,然后连线形成的图像。用来表示趋势,这一节讲线形图及例子。

    第6集 饼图 pie graph

    饼图,看起来像一块切开的饼,用于表示占比。这一节讲饼图及例子。

    第7集 误导人的线形图 Misleading line graphs

    下图主要误导人的地方有两点:
    1. 左右两图的刻度不同,左图的起始刻度是50%,而右图起始刻度是0%,给人感觉像是喜欢Thrill Soda的人超过了Yummy Cola的人,实际上即使喜欢Yummy Cola的人在减少,喜欢Yummy Cola的人远多于喜欢Thrill Soda的人。
    2. 左图和右图刻度距离不同,即右图10%的刻度距离差不多是左图10%距离的1.5倍,导致右图看起来上升幅度更大。
     
    应该将两条折线放在一张图里面更准确、更真实。

    第8集 茎叶图 stem and leaf plot

    茎叶图是将数组中的数按位数进行比较,分别做出茎和叶,以此统计数据。这一讲讲茎叶图及例子。

    第9集 箱线图 Box plot

    盒须图是用四个四分位点分开数据集的图,能有效给出数据散布状况。这一讲讲盒须图及例子。
    箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的最大值、最小值、中位数和两个四分位数;然后, 连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间。
    下图中位数是6,下四分位数是2.5,上四分位数是12.5,最小值是1,最大值是22

    这组数据显示出:

    • 最小值(minimum)=5
    • 下四分位数(Q1)=7
    • 中位数(Med--也就是Q2)=8.5
    • 上四分位数(Q3)=9
    • 最大值(maximum)=10
    • 平均值=8
    • 四分位间距(interquartile range)={displaystyle Q3-Q1}=2 (即ΔQ)

    第10集 箱线图2

    这一讲讲盒须图的另外一个例子,强化盒须图这一重要统计图表的概念。
     

  • 相关阅读:
    C#各版本新特性
    ubantu操作积累
    C# System.Net.Http.HttpClient使用说明
    IIS下VUE跳转
    融合主流的技术 分布式中间件+微服务+微架构架构
    论减少代码中return语句的骚操作
    shell脚本--多个代码库批量pull最新master代码
    SpringBoot单元测试
    Qt音视频开发36-USB摄像头解码qcamera方案
    Qt音视频开发35-Onvif图片参数
  • 原文地址:https://www.cnblogs.com/sxpujs/p/11145387.html
Copyright © 2020-2023  润新知