例2.34 考虑N个人,一些人赞同某个提议,另一些人反对。假定Np个人赞同,N-Np人反对,p未知。现在想要通过随机选取n个人调查他们的态度,并由此来估计总体中赞同这个提议的人员比例p。
设Xi=1表示第i个选到的人赞同。用被取样部分中赞同这个提议的比率作为p的估计,即ΣXi/n,i=[1..n]。
现在我们要求这个估计的方差。先求Var(ΣXi):
Var(ΣXi)=ΣVar(ΣXi)+2ΣΣCov(Xi, Xj)
初看起来和式的第二项貌似多余:每个人的意见不是应该独立的吗?
嗯,每个人的意见确实是“独立”的没错,但“意见上的独立”和统计试验意义上的“独立”完全是两码事。如下:
设事件E1表示抽出的第一个人赞同,事件E2表示抽出的第二个人赞同,
P(E1E2)=P(E2|E1)P(E1),
P(E1)=p, P(E2|E1)=(Np-1)/(N-1), // 第二次抽取时,总人数N-1,赞同人数Np-1。
P(E1)=P(E2)=p,
P(E1E2)!=P(E1)P(E2)。
关键是,P(E2)!=P(E2|E1)。
次序统计量
Xi小于等于x当且仅当X1,...Xn至少有i个小于或等于x。
初看起来不太好理解,上图。
X1 X2 ... Xi-2 Xi-1 Xi Xi+1 Xi+2 ... Xn
----------------------------------x----------->
|
x在这里
如上图是Xi小于x的情况,共有i+2个小于等于x。