• 第七章 参数估计


    参数估计就是要从样本出发构造一些统计量作为总体某些参数(或数字特征)的估计量。

     

    点估计就是构造统计量。

    j=1,2,…n

    的值作为的近似值。对进行估计,叫(点)估计量。若样本值代入称为的估计值。

     

    区间估计是根据样本构造出适当的区间,它以一定的概率包含未知参数。

     

    §7.1 点估计

     

    (一)矩估计法

    1.矩估计法的基本思想

    在总体的各阶矩存在的条件下,用样本的各阶矩去估计总体相应的各阶矩,又由于总体的分布类型已知,总体的各阶矩可表示为未知参数的已知函数,这样样本的各阶矩就与未知参数的已知函数联系起来,从而得到参数的各阶矩。

     

    2.一般求法

     =1,2…k

    =1,2…k

    ‚ =1,2…k

    ƒ代入中, =1,2…k

     

     

    例 2 P159总体X~U[a,b],参数a,b未知,求a,b的矩估计。

     

    例 3 P160

     

     

    以下为第一版例。

     

    例7:总体X~U[0,b],参数b未知,求b的矩估计。

     

    例8:总体未知,已知 是来自总体X的样本值,求的矩估计。

     

    例9:总体的概率密度为

    参数 均未知, 是来自总体的样本,求的矩估计。

     

    3.总体的数学期望与方差的矩估计

    已知总体的二阶矩存在, 是来自总体的样本值。E(X),D(X)的矩估计是

    注意: 此结论用于只要E(x)、D(x)存在的,不论分布是否已知的各类型总体的数字特征E(X)、D(X)的矩估计。

     

    例:总体X~B(N,p), 参数N、0<p<1均未知,已知 是来自总体的样本值,求N,p的矩估计 。

     

     

    (二) 最大似然估计法

    1. 最大似然估计法的基本思想

    例:设在一个口袋中装有许多白球和黑球,但不知是黑球多还是白球多,只知道两种球的数量之比为1:3就是说抽取到黑球的概率

     

    如果用有放回抽取的方法从口袋中抽取n=3个球,发现有一个是黑球,试判断p=?。

     

    X

    0

    1

    2

    3

    时,P(取的三个球中有一个黑球)=大。选取参数总体较合理。故取p的估计值

    最大似然估计基本思想:根据样本的具体情况,选择参数p的估计,使得该样本发生的概率最大。

     

    2.最大似然估计的求法

    设总体的形式已知,参数未知(j=1,2…m), 是来自总体的样本值。

    ,选择参数的估计,使样本取值附近的概率

    =

    = 达到最大,

    等价使 达到最大。

    称L=L()=为样本值的似然函数。

     

    定义7.1如果似然函数L=L()在达到最大值,则称分别为的最大似然估计。

     

    2.一般步骤

    (1).当似然函数可微且参数集合是开集的条件下:

    • 总体

    i =1,2…n

    L=L()=

    取对数

     ②

     ③由似然方程解出=?.。讨论是最大值点,则它是的最大似然估计。

     

    例4 P162 ,求未知参数 的最大似然估计。

     

    例 5 P163 总体未知, 已知 是来自总体X的样本值,求的最大似然估计。

     

    例 6 P165 总体X~U[a,b],参数a,b未知, 已知 是来自总体的样本值,求b的最大似然估计。

     

     

     

    以下为第一版例。

    例2:总体=

    参数未知, 是来自总体的样本值,求的最大似然估计。

    例3:,求未知参数 的最大似然估计。[见书P159,例7.1]

    总体X是离散值,一定要写出X的概率函数。

    例4:一个罐子里装有黑球和白球,每次从中随机的有放回地抽取一个球,直到抽到黑球为止。设停止抽球时所需抽取数是X,这样独立重复的进行了n次实验,获得样本,试求罐子里黑球所占的比例中的最大似然估计。

     

    例5:X服从参数为的威布尔分布,而

    =

    m>0,>0且未知, 是来自总体的样本值,求参数的最大似然估计。

     

    (2)当似然函数L不可数时,或似然函数无解,要用定义求参数的最大似然估计。

    例6:总体X~U[0,b],参数b未知, 已知 是来自总体的样本值,求b的最大似然估计。

     

    3.未知参数的已知函数的最大似然估计有如下规定:

    ,未知参数的已知函数为分别为的最大似然估计,则规定g()为g()的最大似然估计。

    例:P习题7.5。

     

     

    §7.2 估计量评选标准

     

    1.无偏性:

    定义:设()是的估计量,若E()=,对一切,则称的无偏估计量,否则称为的有偏估计量。其偏差度为= E()-。如果 E()=,则称的渐近无偏估计量。

     

    书上定义是对g()而言的:

    定义:设未知参数的已知函数g()的估计量为,如果对一切都有

    则称的无偏估计量。

     

    例10:设总体有二阶矩,E(X)=,D(X)=存在,是该总体的样本,证明的无偏估计,的无偏估计,但不是的无偏估计,是的渐近无偏估计。

     

    例11:总体X~U[a,b],b>0,试问b的矩估计是否是b的无偏估计量。

    注意:

    (1)若的无偏估计,g()为的已知函数,而g()不一定是g()的无偏估计。

    (2)有时的有偏估计也可稍加修改为无偏估计。

    例:设的无偏估计,但不是

    的无偏估计,可修改为它是的无偏估计。

    2.有效性

    定义:若都为的无偏估计量。若 且至少对一个,有严格不等号成立,则称有效。

    例12:比较,()。估计,哪个有效。

    定义:设都是g()的估计量, 如果对一切都有

     -g()]- g()]

    且存在,有严格不等号成立,则称有效。

    此定义为均方误差准则。

    3.相合性(一致估计量)

    定义7.5:设g()的估计量为,如果对任意的>0,都有

    =1

    则称的相合估计量。

     

    §7.2 区间估计

    一.基本概念

    , 是两个统计量,且满足,则称[A,B]为一随机区间。

     

    定义7.6:对于给定的正数,如果对一切都有

    则称[A,B]为的置信度为的置信区间,称为置信区间的置信度,称A、B分别为置信下限和置信上限。

    常用的形式:

        

     

    例:某旅游社为调查当地每一旅游者的平均消费额,随机访问了100名旅游者,得知平均消费额(元)。根据经验,已知旅游者消费额服从正态分布,且标准差(元),那麽该地旅游者平均消费额的置信度为95%的置信区间是什麽。

    设旅游者消费额为,且知,此题是求的置信区间的问题。

    (1)找的较好点估计(最大似然估计或无偏估计),

    (2)为使,要选有关的函数且知其分布。当已知时,

     

    为枢轴变量。对给定的,使

    (3)将不等式 等价变形

    本例,计算

    得到,当地每位旅游者置信度为95%的平均消费额在[77.6元,82.4元]之间。

     

    Data;

    u=probit(1-0.05/2);put u=;

    A=80-(u*12)/sqrt(100); put A=;

    B=80+(u*12)/sqrt(100); put B=;

    run;

     

    u=1.9599639845

    A=77.648043219

    B=82.351956781

     

     

    定义:叫区间半径,叫区间中心,

    叫区间长度。

     

     

    二.置信区间的一般求法 (枢轴量法)

    (1)从的一个较好点估计出发,构造的一个函数 ,且知其分布又与无关,函数H称为枢轴变量。

    (2)记H的上分为数和上(1-)分位数为,使对给定的,有

    利用不等式运算,将不等式

    进行等价变形,使得最后得到形如:

    的不等式。

    就是置信区间,这时有:

    定义:叫区间半径,叫区间长度。

     

    例1 P170,计算机实现过程。

     

    Data;

    z=probit(1-0.05/2);put z=;

    A=5.2-(z*1)/sqrt(16); put A=;

    B=5.2+(z*1)/sqrt(16); put B=;

    C=B-A; put C=;

    run;

    z=1.9599639845

    A=4.7100090039

    B=5.6899909961

    C=0.9799819923

     

    P171页下面部分的数值解释。

    Data;

    u1=probit(0.04);put u1=;

    u2=probit(1-0.01);put u2=;

     

    A=5.2+(u1*1)/sqrt(16); put A=;

    B=5.2+(u2*1)/sqrt(16); put B=;

    C=B-A; put C=;

    run;

    u1=-1.750686071

    u2=2.326347874

    A=4.7623284822

    B=5.7815869685

    C=1.0192584863

     

     

     

    三.正态总体的参数的区间估计

    1.一个正态总体的均值、方差的置信区间

    设总体是来自总体的样本

    (1)已知,均值的置信度为的置信区间为:

    (2)未知,均值的置信度为的置信区间为:

    (3)未知,方差的置信度为的置信区间为:

    的置信区间为:

     

    1. 两个正态总体均值差方差比的置信区间

     

    总体

    样本

    均值

    样本方差

    两个样本相互独立。

    (1)已知,均值差的置信区间为

    (2)未知,但的置信区间为

    []

    (3)未知,方差比的置信区间为:

    []

    (4) 已知,的置信区间为:

    []

     

     

    1. P174

     

     

    Data;

    t=TINV((1-0.05/2),15); put t=;

    A=503.75-t*6.2022/sqrt(16); put A=;

    B=503.75+t*6.2022/sqrt(16); put B=;

    C=B-A; put C=;

    run;

    t=2.1314495456

    A=500.44508091

    B=507.05491909

    C=6.6098381857

     

    例2 P175

    Data;

     

    k1=CINV(1-0.05/2, 15);put k1=;

    k2=CINV(0.05/2, 15);put k2=;

     

    A=sqrt(15)*6.2022/sqrt(k1); put A=;

    B= sqrt(15)*6.2022/sqrt(k2); put B=;

    C=B-A; put C=;

    run;

    k1=27.488392863

    k2=6.262137795

    A=4.5815952687

    B=9.5990905015

    C=5.0174952328

     

    例 3 P177

    Data;

    t=tINV(1-0.05/2, 28);put t=;

    sw=sqrt((9*1.1**2+19*1.2**2)/28); put sw=;

    A=500-496-sw*t*sqrt(1/10+1/20); put A=;

    B=500-496+sw*t*sqrt(1/10+1/20); put B=;

    C=B-A; put C=;

    run;

     

    t=2.0484071418

    sw=1.1687905837

    A=3.0727462146

    B=4.9272537854

    C=1.8545075707

     

    例 4 P177

     

    Data;

    t=tINV(1-0.05/2, 14);put t=;

    sw=sqrt((7*3.89+7*4.02)/14); put sw=;

    A=91.73-93.75-sw*t*sqrt(1/8+1/8); put A=;

    B=91.73-93.75+sw*t*sqrt(1/8+1/8); put B=;

    C=B-A; put C=;

    run;

    t=2.1447866879

    sw=1.9887181801

    A=-4.152688139

    B=0.1126881394

    C=4.2653762788

     

    例 5 P179

     

    data ;

    F1=FINV(1-0.1/2, 17,12) ; put F1=;

    F2=FINV(0.1/2, 17,12) ; put F2=;

    A=0.34/(0.29*F1); put A=;

    B=0.34/(0.29*F2); put B=;

    C=B-A; put C=;

    Run;

    F1=2.5828389059

    F2=0.4200526125

    A=0.4539244745

    B=2.7911117756

    C=2.3371873011

     

    §7.5 (0---1)分布参数的区间估计

     

    P179

     

    例 P180

    data;

    z=probit(1-0.05/2);put z=;

    a=100+z**2; put a=;

    b=-(2*100*0.6+z**2); put b=;

    c=100*0.6**2; put c=;

    p1=1/(2*a)*(-b-sqrt(b**2-4*a*c)); put p1=;

    p2=1/(2*a)*(-b+sqrt(b**2-4*a*c)); put p2=;

    p=p2-p1; put p=;

    run;

     

    z=1.9599639845

    a=103.84145882

    b=-123.8414588

    c=36

    p1=0.5020025868

    p2=0.6905987136

    p=0.1885961268

     

     

     

    §7.6 单侧置信区间

     

    对于均值,单侧置信区间下限。公式(6.4)

    对于方差,单侧置信区间上限。公式(6.6)

     

    例 P182

     

    Data;

    t=tINV(1-0.05, 4);put t=;

    mu=1160-sqrt(9950/5)*t; put mu=;

    run;

    t=2.1318467863

    mu=1064.8995598

     

    习题:

    1,2,3,5,6,10,14,15,19,25

  • 相关阅读:
    15、SQL基础整理(视图)
    14、SQL基础整理(存储过程)
    13、SQL基础整理(流程控制begin……end)
    12、SQL基础整理(运算符与优先级)
    11、SQL基础整理(变量)
    10、SQL基础整理(约束2)
    9、SQL基础整理(两表连接exists,join on,union)*Oracleも含む(INTERSECT&MINUS)
    20141113--SQL 事务
    20141111--SQL触发器
    20141110--SQL视图
  • 原文地址:https://www.cnblogs.com/begtostudy/p/1986342.html
Copyright © 2020-2023  润新知