• Applied Nonparametric Statistics-lec8


    Ref:https://onlinecourses.science.psu.edu/stat464/print/book/export/html/11


    additive model

    value = typical value + row effect + column effect + residual

    predicate value = typical value + row effect + column effect

    其中value是我们关注的值,typical value是overall median,row effect是block effect,column effect是treatment effect

    下面用例题来展示:

    问题:对于面包中烟酸(维生素B3)的含量,三个实验室(abc)的测量方法可能不同。烟酸的含量分为三档:

    no niacin、2mg/100gm、4mg/100gm。我们把一些样本送到三个实验室做检测,希望知道:划分档次时,是否

    基于烟酸的实际含量。

    输入:niacin_r.txt(参见网页)

    步骤一:

    Plots the mean (or other summary) of the response for two-way combinations of factors, thereby illustrating possible interactions.

    data = read.table("niacin_r.txt", header=F, sep=",")
    data = as.data.frame(data)
    names(data)=c("niacin", "lab", "level")
    attach(data)
    interaction.plot(lab, level, niacin, fun=median)
    detach(data)  
    

    结果如图

    因为三条线基本是平行的(没有明显的交叉),所以我们可以继续做。(additive model没有考虑interaction的情况)

    现在需要整理一下数据:首先将数据按照lab和level聚集一下

    a=aggregate(niacin~lab+level, data=data, median)  

    结果是这样的:

    > a
      lab level niacin
    1   a     0     36
    2   b     0     38
    3   c     0     39
    4   a     2     53
    5   b     2     56
    6   c     2     55
    7   a     4     68
    8   b     4     76
    9   c     4     73  

    然后将它变成矩阵,每一行表示block(这里是level水平,0,2,4),每一列表示treat(这里是lab,abc)

    > m=matrix(a[,3], nrow=3, ncol=3, byrow=T)
    > m
         [,1] [,2] [,3]
    [1,]   36   38   39
    [2,]   53   56   55
    [3,]   68   76   73  

     步骤二:median polish

    > medpolish(m)
    1: 7
    Final: 7
    
    Median Polish Results (Dataset: "m")
    
    Overall: 55
    
    Row Effects:
    [1] -17   0  18
    
    Column Effects:
    [1] -2  1  0
    
    Residuals:
         [,1] [,2] [,3]
    [1,]    0   -1    1
    [2,]    0    0    0
    [3,]   -3    2    0  

    这样我们已经得到了完整的additive model,其中typical value即overall,也就是55。

    注意:medpolish实际是将前面的结果做了一个拆分,比如

    m[1,1] = 36 = overall + column_effect[1] + row_effect[1] + residuals[1, 1] = 55 + (-17) + (-2) + 0

    为了确定模型的好坏,我们计算统计量R*。如上例,TV是55,计算出R*约为0.9346,也就是说,考虑了lab和level的这种

    additive model,可以解释93%的烟酸水平评定结果。

    (the additive model of the labs and levels of niacin explain about 93% of the variation in the measured niacin levels.)


    如果三条线有交叉,就要对每个block(每行)分别进行考虑,使用kruskal test。如果overall error rate是0.09,3个block的话,

    那么每个的α值就是0.03(p值小于它就拒绝原假设)。

    判断interaction的统计量可以用上面得到的Residuals矩阵,使用Q这个统计量,使用自由度为(b-1)×(k-1)的卡方分布决定p值


    Dichotomous Data (Cochran's Tests)

    b个block,k个treatment,实际数值只有两种,即0和1

    前提:blocks是随机选择的;结果变量是二值化的。

    假设:

    H0:treatments are equally effective
    H1:difference in effectiveness among treatments.

  • 相关阅读:
    Android应用开发——系统自带样式Android:theme
    Android权限Uri.parse的详细资料
    Android中级教程之Log图文详解(Log.v,Log.d,Log.i,Log.w,Log.e)!
    Android源码下载方法详解
    C#编程中的66个好习惯,你有多少个
    浏览时只显示指定文件类型
    如何在32位ubuntu11.10 下编译android 4.0.1源码和goldfish内核
    USACO2.3.1 The Longest Prefix 题解
    usaco1.1.3 Friday the Thirteenth 题解
    USACO 2.4.5 Fractions to Decimals 题解
  • 原文地址:https://www.cnblogs.com/pxy7896/p/7048198.html
Copyright © 2020-2023  润新知