• 方差分析anova


    方差分析

    试验指标:试验中要考察的指标,即收入
    因素:影响试验指标的条件,如性别,年龄
    水平:因素所处的状态,比如性别的分为男,女
    单因素试验:在一项试验中只有一个因素改变
    多因素试验:在一项试验中有多个因素改变

    单因素方差分析

    方差分析(Analysis of Variance,简称ANOVA),又称F检验,用于两个及两个以上样本均数差别的显著性检验。方差分析主要是考虑各组之间的均数差别。

    单因素方差分析(One-wayAnova),是检验由单一因素影响的多组样本某因变量的均值是否有显著差异。

    当因变量Y是数值型,自变量X是分类值,通常的做法是按X的类别把实例成分几组,分析Y值在X的不同分组中是否存在差异。

    from scipy import stats
    a = [47,56,46,56,48,48,57,56,45,57]  # 分组1
    b = [87,85,99,85,79,81,82,78,85,91]  # 分组2
    c = [29,31,36,27,29,30,29,36,36,33]  # 分组3
    print(stats.f_oneway(a,b,c))


    返回结果的第一个值为统计量,它由组间差异除以组间差异得到,上例中组间差异很大,第二个返回值p-value=6.2231520821576832e-19小于边界值(一般为0.05),拒绝原假设, 即认为以上三组数据存在统计学差异,并不能判断是哪两组之间存在差异 。只有两组数据时,效果同 stats.levene 一样。

    多因素方差分析

    • 多因素方差分析用来研究两个及两个以上控制变量是否对观测变量产生显著影响。多因素方差分析不仅能够分析多个控制变量对观测变量的独立影响,更能够分析多个控制变量的交互作用能否对观测变量产生显著影响,最终找到利于观测变量的最优组合
    from statsmodels.formula.api import ols
    from statsmodels.stats.anova import anova_lm
    import pandas as pd
    
    X1 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2] 
    X2 = [1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2]
    Y  = [76,78,76,76,76,74,74,76,76,55,65,90,65,90,65,90,90,79,70,90, 88,76,76,76,56,76,76,98,88,78,65,67,67,87,78,56,54,56,54,56] 
    
    data = {'T':X1, 'G':X2, 'L':Y}
    df = pd.DataFrame(data)
    formula = 'L~T+G+T:G' # 公式                                        
    model = ols(formula,df).fit()
    print(anova_lm(model))

  • 相关阅读:
    Docker基础 ubuntu安装docker
    layui.laytpl 模板引擎用法
    golang 中 strings 包的 Replace 用法介绍笔记
    golang之结构体
    Mysql复习秘籍
    NFS 共享存储
    Rsyncd 同步服务
    企业服务器架构
    基础面试题二
    基础面试题一
  • 原文地址:https://www.cnblogs.com/raisok/p/12659544.html
Copyright © 2020-2023  润新知