• 数据的正态分布验证和方差齐性检验


    在对数据进行统计分析之前,应该先查看数据的特征,然后根据其特征选择分析方法。

    很多统计假设方法要求数据是符合正态分布的和方差齐性。

    1.数据的正态分布验证:

    • 夏皮罗-威尔克(Shapiro-Wilk)检验法,适用于3 < 样本数< 5000 时的正态性检验。
    > data2
     [1] 10  7 20 14 14 12 10 23 17 20 14 13
    > a=shapiro.test(data2)
    > a
    
        Shapiro-Wilk normality test
    
    data:  data2
    W = 0.95757, p-value = 0.7487
    ##p值表示这个数据群是正态分布的概率

    2.方差齐性检验

    Bartlett检验 - 如果我们的数据服从正态分布,那么这种方法将是最为适用的。对于正态分布的数据,这种检验极为灵敏;而当数据为非正态分布时,使用该方法则很容易导致假阳性误判。

    > data
       count spray
    1     10     A
    2      7     A
    3     20     A
    4     14     A
    5     14     A
    6     12     A
    7     10     A
    8     23     A
    9     17     A
    10    20     A
    11    14     A
    12    13     A
    13    11     B
    14    17     B
    15    21     B
    16    11     B
    17    16     B
    18    14     B
    19    17     B
    20    17     B
    21    19     B
    22    21     B
    23     7     B
    24    13     B
    > bartlett.test(count~spray,data=data)
    
    	Bartlett test of homogeneity of variances
    
    data:  count by spray
    Bartlett's K-squared = 0.10464, df = 1, p-value = 0.7463
    ##p值是条件A和条件B的方差齐性的概率
    

      

    拒绝低效率勤奋,保持高效思考
  • 相关阅读:
    JIRA /mnt/server/atlassian-jira-6.3.6-standalone/bin/start-jira.sh
    nginx 优化
    SVN GIT
    实时流量监控脚本
    python升级导致yum命令无法使用的解决
    流量查看命令
    mysql查询表的数据大小
    hdu1171&&P2000——母函数
    母函数入门【模板】
    BZOJ2159 Crash的文明世界——树上DP&&第二类Stirling数
  • 原文地址:https://www.cnblogs.com/timeisbiggestboss/p/7792529.html
Copyright © 2020-2023  润新知