我们已经知道一个事件的概率和随机变量这些基本概念
我们要想弄清楚 一个随机变量的规律性,就必须知道它的概率分布,概率分布知道,则什么都可以算出来。或者退而求其次,至小要知道它的数字特征,如数学期望,方差,等。而我们的理想是知道总体的,但现实 不可以,我们又退而求其次,求出样本的,但知道样本的不是我们的目的,我们的目的是知道总体的,一定要牢记这一点,所以我们要研究的是如何通过样本得到你想要的总体。
一。
我们就抓住一个概率样本的统计量,这是一个样本一有,它就可以确定知道的量。
第一类数字特征
1.如样本均值,样本方差,均方差(样本标准差),二阶中心矩,变异系数,样本矩
2.从布的角度看,如偏度,峰度
第二类(是我自己这样分的)
上面的数字特征是相应总体特征 值的一种估计,但它更适合于来处正太分布的数据分析。若总体分布未知,或者就不是正态分布,而是严重的偏态,或者有一些极端值,上述的分析方法就不适合了,而应计算中 位数,分位数,三均值,极差等数字特征,计算上述统计值就要用到次序统计量。
二.有了数字特征,最好还能搞出分布出来 ,所以我们对数据的总体情况作全面的描述,就要研究试验数据的分布。
对试验数据的描述方法主要是
频率分布表,直方图,经验分布函数,QQ图,茎叶图,箱线图
注:直方图是对总体是连续分布的情况比较好,而一般的情况下用经验分布函数
这个和老是曾上课时说的是一个道理
即,概率密度曲线只有连续型的才有,(直方图本质就是概率密度曲线),而更一般的情况 下,所有的随机变量都有分布函数 ,所以经验分布函数更广。
请看2.Matlab实现: