• 如何选择正确的统计分析方法


    一、确定假设检验方法

      1、成组设计:比较男性和女性对某电影的评分

      2、配对设计、配伍设计:受试者在三种候选包装中选择最满意的一种

      3、更加复杂的试验设计:拉丁方设计、均匀设计等

    二、变量类型

      1、连续变量:两种促销方式的销量比较;单样本T检验

      2、有序变量:评价结果为优良中差的比较;秩和检验

      3、无序变量:不同学校的毕业生择业去向比较;二项分布、卡方分布检验

    三、因变量(连续)

      1、单个自变量:二分类、t检验

      ·成组t检验,促销活动对销量有无影响

      ·配对t检验,培训前后销售额的比较

      2、单个自变量:多分类、单因素方差分析

      ·三种促销方式的销量比较

      ·后续有两两比较的问题

      3、单个自变量:连续

      ·相关分析:考察两变量在数量上依存关系

      ·回归分析:考察一个变量对另一个变量影响程度的大小

      4、多个自变量:分类变量为主,方差分析模型

      ·便于两两比较

      ·有多种图形帮助分析

      ·自变量间可能有主次之分

      5、多个自变量:连续变量为主,线性回归模型

      ·本质上和方差分析模型等价

      ·可利用散点图、回归线等图形帮助解释

      ·可用逐步法对自变量进行自动筛选

    四、因变量(有序分类)

      1、当分类较多,可近似按照连续变量处理

      2、单个自变量:

      ·二分类、秩和检验

      ·多分类、秩和检验

      ·连续、Logisstic回归

      3、多个自变量

      ·Logisstic回归

      ·判别分析

      ·最优尺度分析

    四、因变量(无序分类)

      1、单个自变量

      ·二分类 卡方检验

      ·多分类 卡方检验

      ·连续

      2、多个自变量

      ·Logisstic回归

      ·判别分析

      ·最优尺度分析

    五、总结

      1、对连续因变量的统计方法是最全面的

      2、有序分类变量往往都近似的在当作连续性变量处理

      3、或者退化成无序分类变量处理无序分类因变量一般使用卡方检验,但只能得到粗糙的结果,精细分析困难

      4、复杂的统计模型实际上都是让各种变量在拟合时尽量向连续性变量靠拢(变量变换、概率评分)

  • 相关阅读:
    网络编程
    正则表达式
    对空气质量历史数据的爬取
    通过移动设备行为数据预测性别年龄
    电影口碑与海报图像的相关性分析
    微博情感分析
    《python3网络爬虫开发实战》--验证码的识别
    python编程快速上手
    Echarts树图定制详解
    Servlet学习笔记【2】---Http数据包
  • 原文地址:https://www.cnblogs.com/wu-wu/p/12157367.html
Copyright © 2020-2023  润新知