• 极大似然估计理解与应用


    1. 什么是极大似然估计

      在日常生活中,我们很容易无意中就使用到极大似然估计的思想,只是我们并不知道极大似然估计在数学中的如何确定以及推导的。下面我们使用两个例子让大家大概了解一下什么是极大似然估计

    (1)猎人师傅和徒弟一同去打猎,遇到一只兔子,师傅和徒弟同时放枪,兔子被击中一枪,那么是师傅打中的,还是徒弟打中的?
    (2)一个袋子中总共有黑白两种颜色100个球,其中一种颜色90个,随机取出一个球,发现是黑球。那么是黑色球90个?还是白色球90个?

      对于第(1)个问题,由于师傅的技术一般比徒弟高,因此我们会猜测兔子是师傅打中的。对于第(2)个问题,对于颜色有90个的球,我们抽中它的概率更大,因此当抽中为黑色球时,我们便会认为90个的是黑色球。
      对于以上两个例子可以看出,我们在进行猜测时,往往认为:概率最大的事件,最可能发生因此在一次试验中就出现的事件应当具有较大的概率。


    2. 极大似然原理及数学表示

      极大似然原理是指:若一次试验有 $ n $ 个可能结果 $ A_1, A_2,...,A_n $ ,现在我们做一次试验,试验的结果为 $ A_i $ ,那么我们就可以认为事件 $ A_i $ 在这个 $ n $ 个可能结果中出现的概率最大。
      极大似然估计是指:在一次抽样中,样本出现的概率是关于参数 $ heta $ 的函数,若在一些试验中,得到观测值 $ x_1,x_2,...,x_n $ ,则我们可以选取 $ hat{ heta}(x_1,x_2,..,x_n) $ 作为 $ heta $ 的估计值,使得当 $ heta = hat{ heta}(x_1,x_2,..,x_n) $ 时,样本出现的概率最大。而极大似然估计就是要求解出参数 $ heta $ 的估计值。可采用极大似然估计法


    3. 极大似然估计法(Maximum Likelihood Estimation,MLE)

      (1)若总体 $ X $ 为离散型
        假设分布律为 $ P lbrace X=x brace = p(x; heta) $ ,$ heta $ 为待估计参数,$ p(x; heta) $ 表示估计参数为 $ heta $ 时,发生 $ x $ 的概率。
        那么当样本值为: $ x_1,x_2,...,x_n $ 时, $$ L( heta) = L(x_1,x_2,...,x_n; heta) = prod_{i=1}^n p(x_i; heta) $$
        其中 $ L( heta) $ 称为样本的似然函数。
        若满足: $$ L(x_1,x_2,...,x_n;hat{ heta}) = max_{ heta}L(x_1,x_2,...,x_n; heta) $$
        也就是说,当参数 $ heta = hat{ heta} $ 时,似然函数可以取最大值,那么 $ hat{ heta} $ 就叫做参数 $ heta $ 的极大似然估计值。
      (2)若总体 $ X $ 为连续型
        假设概率密度为 $ f (x; heta) $ ,$ heta $ 为待估计参数。
        那么当样本值为: $ x_1,x_2,...,x_n $ 时, $$ L( heta) = L(x_1,x_2,...,x_n; heta) = prod_{i=1}^n f(x_i; heta) $$
        其中 $ L( heta) $ 称为样本的似然函数。
        若满足: $$ L(x_1,x_2,...,x_n;hat{ heta}) = max_{ heta}L(x_1,x_2,...,x_n; heta) $$
        也就是说,当参数 $ heta = hat{ heta} $ 时,似然函数可以取最大值,那么 $ hat{ heta} $ 就叫做参数 $ heta $ 的极大似然估计值。


    4. 极大似然估计法求估计值的步骤:

      (1)构造似然函数 $ L( heta) $ :
         $ L( heta) =prod_{i=1}^n p(x_i; heta) (离散型) ; L( heta)=prod_{i=1}^n f(x_i; heta) (连续型) $
      (2)取对数: $ log L( heta) $ (以 $ e $ 为底);
      (3)令 $ frac{delta log L( heta)}{delta heta} = 0 $ ;
      (4)解似然方程得到 $ heta $ 的极大似然估计值 $ hat{ heta} $ 。


    5. 极大似然估计法应用

      (1)假设一个袋子装有白球与红球,比例未知,现在抽取10次(每次抽完都放回,保证事件独立性),假设抽到了7次白球和3次红球,在此数据样本条件下,可以采用最大似然估计法求解袋子中白球的比例。
        求解过程:
        该试验属于二项分布,我们定义 $ M $ 为模型,抽到白球的概率为 $ heta $ ,而抽到红球的概率为 $ 1- heta $ ,因此10次抽取抽到白球7次红球3次的概率(似然函数)为: $$ L( heta) = egin{pmatrix} 10 7 end{pmatrix} P(x_1,x_2,...,x_{10}|M) = egin{pmatrix} 10 7 end{pmatrix} P(x_1|M) imes P(x_2|M) imes ... imes P(x_{10}|M) = egin{pmatrix} 10 7 end{pmatrix} heta^7(1- heta)^3 $$
        其对数似然函数为: $$ log L( heta) = log [ egin{pmatrix} 10 7 end{pmatrix} heta^7(1- heta)^3 ] $$
        求 $$ frac{delta log L( heta)}{delta heta} = 0 $$
        即 $$ 7 heta^6(1- heta)^3 - 3 heta^7(1- heta)^2 = 0 implies heta = 0.7 $$ ,
        二项式系数为常数,在求导过程中会被抵消
        故白球的比例为 $ 0.7 $ 。
      (2)设总体 $ X ~ N(mu, sigma^2) $ ,$ mu, sigma^2 $ 为未知参数,$ x_1,x_2,...,x_n $ 是来自 $ X $ 的一个样本值,求 $ mu, sigma^2 $ 的极大似然估计值。
        求解过程:
         X的概率密度为: $$ f(x;mu,sigma^2)=frac{1}{sqrt{2pi}sigma} e^{-frac{(x-mu)^2}{2sigma^2}} $$
         似然函数为: $$ L(mu,sigma^2) = prod_{i=1}^n frac{1}{sqrt{2pi}sigma} e^{-frac{(x_i-mu)^2}{2sigma^2}} $$
         取对数为: $$ log L(mu,sigma^2) = -frac{n}{2} log (2pi) - frac{n}{2} log sigma^2 - frac{1}{2sigma^2} sum_{i=1}^n(x_i-mu)^2 $$
         令 $$ egin{cases} frac{delta}{delta mu} log L(mu,sigma^2) = 0 frac{delta}{delta sigma^2} log L(mu,sigma^2) = 0 end{cases} $$
         即 $$ egin{cases} frac{1}{sigma^2}[sum_{i=1}^n x_i - n mu] = 0 - frac{n}{2 sigma^2}+ frac{1}{2(sigma^2)^2} sum_{i=1}^n (x_i-mu)^2 = 0 end{cases} $$
        求得参数估计值为: $$ egin{cases} hat{mu} = frac{1}{n} sum_{i=1}^n x_i =overline{x} hat{sigma}^2 = frac{1}{n}sum_{i=1}^n(x_i-overline{x})^2 end{cases} $$


    引用及参考:
    [1] https://www.jianshu.com/p/f1d3906e4a3e
    [2] https://blog.csdn.net/zengxiantao1994/article/details/72787849
    [3] https://wenku.baidu.com/view/0d9af6aa172ded630b1cb69a.html
    [4] https://www.cnblogs.com/xing901022/p/8418894.html

    写在最后:本文参考以上资料进行整合与总结,属于原创,文章中可能出现理解不当的地方,若有所见解或异议可在下方评论,谢谢!
    若需转载请注明https://www.cnblogs.com/lliuye/p/9139032.html

  • 相关阅读:
    java ee / video / rtsp / rtmp / fuck douyin / fuck douyincdn / fuck amemv.com
    6步 实现 mysql8.0 MGR架构
    使用redis zset 数据结构进行分数排名
    First Look at Some of the GTK4 Apps in GNOME 42
    Introducing LibadwaitaGTK 3 (and libhandy) to GTK 4 and libadwaita for GNOME 41 GNOME 42
    Send same packets to multiple clients
    LeetCode 207. Course Schedule
    LeetCode 210. Course Schedule II
    LeetCode 106. Construct Binary Tree from Inorder and Postorder Traversal
    LeetCode 797. All Paths From Source to Target
  • 原文地址:https://www.cnblogs.com/lliuye/p/9139032.html
Copyright © 2020-2023  润新知