• 均值和最小二乘法


    有一维数组 [x1,x2...xn],要求一个值X,使得:

    F(X) = (X-x1)2+(X-x2)2+...(X-xn)2 = min

    F(X) = nX2 -  2 * (x1+x2+....+xn) + x12 + x22 + ...+xn2 = min 

    对X求导,当dF/dX = 0时,F(X)有极小值;

    2nX - 2 (x1+x2+....+xn) = 0 

    那么,X =  (x1+x2+....+xn) / n

    因此,在一维的情况下,最小二乘求参数X,和求均值一样;

    使用矩阵的方法,先建立方程组:

    X - x1 = 0

    ...

    X - xn = 0

    也就是方程组:

    An*1X =b,等价于  [1,1,......] T X = [x1,x2...xn] T;

    ATAX = ATb

    同样解得:X =  (x1+x2+....+xn) / n


    应用:在一维中,有[2,2,2,2,2,10]这样子的数组,找出其中的孤值

    先求出 X = 均值 =  3.333

    中误差 = sqrt [ [(2-3.333)2 +  (2-3.333)2 +  (2-3.333)2 +  (2-3.333)+  (2-3.333)2 + (10-3.333)2 ] / (6-1) ] = 3.1622

    假如一维数组是对一段距离的观测值,假设服从正态分布N[ μ,σ2] , u应该是接近2的数字,但实际上是不可知道的,样本量大时,通常用X和中误差来代替 

    |xn - u| > 2σ  的概率,为 1 - 95.449974%;

    |xn - u| > 3σ  的概率,为 1 - 99.730020%;

    所以,基于这个原理,|10 - 3.3333 | ≈ 2σ ,是属于小概率事件,所以认为10是孤值;


     加权最小二乘法;

    假如,为上面每个数字,求加权平均值,假如权值分别为[p1,p2....pn],假如为[1,1,1,1,1,1/5]

    加权并不是:X =( 2+ 2 + 2 + 2 +2 + 1 / 5 * 10 )/ 6 = 2;

    而是F(X) =  p1(X-x1)2+p2(X-x2)2+...p3(X-xn)2 = min

     F'(X) = 2 (p1 + p2 + ... pn) - 2 (p1x1 + p2x2 + ... + pnXn)

    因此X = (p1x1 + p2x2 + ... + pnXn) / (p1 + p2 +...+pn) = 12 / 5.2 = 2.3 

    如同解 ATPAX = ATPb

     p越大,说明对某个观测值越信赖,对其误差也越信赖;


    关于误差传播

    假如x经过n次读数,其中误差 = Σ(xi - xavg)² / n,用矩阵的形式,就是Dxx = [x1-xavg ,x2-xavg,... xn-xavg]  [x1-xavg ,x2-xavg,... xn-xavg] T / n 

    * 定义函数E(x)为求x的均值,那么Dxx = E[ [x1-xavg ,x2-xavg,... xn-xavg]  [x1-xavg ,x2-xavg,... xn-xavgT]

    假如 y = ax,那么,其中误差 = Σ(axi - axavg)² / n = a, 就是Dyy = a2 Dxx

    因此,在一元的情况下 y = ax,y的方差D(Y) = a2 Dxx

    多元的情况下:

    z = ax - by ,用矩阵的形式表示,那么 Z = [a,b][x,y]= KX

    E(Z) = KE(X)

    证明:

    E(X) = [E(x),E(y)]T 

    E(Z) = ∑z / n  = a * ∑x / n + b∑y / n  = aE(x) + bE(y) = K[E(x),E(y)]T =  KE(X)

    D(Z) = E ( [Z-E(Z)] [Z-E(Z)]T)

       =  E ( [KX - KE(X)] [ KX - KE(X)]T

       =   E ( K[X -  E(X)] [ X -  E(X)]T KT)   (KA)T = ATKT

       =  KE ( [X -  E(X)] [ X -  E(X)]) KT

    Dxx = E ( [X -  E(X)] [ X -  E(X)])   = [x-xavg ,y-yavg   [x-xavg ,y-yavg ]   / n

     X = [x,y], E(X) = [E(x),E(y)]T

    因此,Dxx 对角  (x-E(x))(x-E(x))T / n,为x的方差; (y-E(y))(y-E(y))T / n 为y的方差;

    非对角 (x-E(x))(y-E(y))T / n ,为x和y的协方差;

    协方差的本质,是形容X的曲线,和Y的曲线的相似程度,其横轴均为样本序列


    在实际解算的时候,如果两种观测量(x和y)是完全不相关的,例如: x代表测角、y代表测距 ,即使(x-E(x))(y-E(y))T / n ≠ 0,在Dxx的非对角处,任然写为0值;

    因此求Dzz要追根朔源

    假如有:

    z1 = a1x + b1y

    z2 = a2x + b2y

    z1和z2如何才是独立观测量,完全不相关?

    等价于Dzz,非对角线元素为0

     隐含条件:

    1. a1、b1不能同时为0 ,否则相当于Z1没有意义;

    2. a2、b2不能同时为0 ,否则相当于Z2没有意义;

    3. σxx 和 σyy 均不能等于0,否则解算没有意义,因为没有误差传递;

    那么,要使得非对角线为0,那么:

    1. a1 = 0 ,b2 = 0, σxy = 0;

    1. b1 = 0 ,a2 = 0, σxy = 0;

    没有别的选择;

    因此,x、y必须是独立观测的,不相关的观测量,而且,Z的方程组,每条方程的自变量均不相同,要么:

    z1 = a1x  

    z2 = b2y

    或者

    z1 = b1y

    z2 = a2x  

  • 相关阅读:
    对scott中emp表进行各种操作
    可兼容的事件绑定方法
    深度复制
    原型链的继承
    如何在github上发布自己的项目
    用单例连接oracle数据库
    Struts2之输入验证
    JSP之监听器Listener(二)
    JSP之监听器Listener(一)————————ServletContextListener
    JSP之过滤器Filter
  • 原文地址:https://www.cnblogs.com/pylblog/p/11359863.html
Copyright © 2020-2023  润新知