• Estimating Gene Frequencies| method of maximum likelihood|point estimate


    I.11 Estimating Gene Frequencies

    在小样本上计算基因A的概率PA,举例如下:

     

    通过加大样本会将通过观察值得到的数趋近于真实数据,所以该问题转化为了统计学上利用大量观察值求真实值的问题,因此通过最大似然估计得到真实值.

     为了理解多项式分布可以先以二项分布为例:

    该二项分布来自:

     

    其实它的完整形式是:

     

    因为二项分布是当多项式分布的项数为2时的分布:

     

    所以当有三项(AAAaaa)的时候我们采用多项式分布:于是就有

     

    其中,p就是PA,就是我们估计的参数,nAAnAanaa是给定值。

    由于组合数是一个常数,用C代替,得到:

     

    此时,采用最大似然估计,(即找到使概率值最大的参数p,即将p的表达式对p求导,然后导数为零时,便有最大函数值(概率值)。)

    为方便求导两边取对数:

     

    求导:

     

    化简后得到:

     

  • 相关阅读:
    对于js中原型的理解
    换行问题
    居中方法
    浮动清除
    js基础内容 原型与实例
    uniapp 吸顶 小demo
    uniapp 锚点滚动报错(h.push is not a function)
    uni-app 页面滚动到指定位置
    过滤后端返回的html文本标签
    uniapp 上拉加载
  • 原文地址:https://www.cnblogs.com/yuanjingnan/p/11161022.html
Copyright © 2020-2023  润新知