• ch4-SPSS Statistics操作进阶


    知识点:

    单选题、多选题录入

    分析前的数据清洗,包括删除重复记录、异常值、逻辑校验

    总体和样本分布结构不一致的情况下的数据加权

    相关问题分析时的交叉表

    1、项目背景

    2、问卷录入

    单选题的定义:

      当定义了变量的值,如:1=“男”,2=“女”,在录入时可以通过“显示指标签”图标来通过下拉框选择的方法“选择男或女”来录入。

    多选题的定义:

      首先确定使用二分法或多重分类法录入;

      其次,定义多选项变量集有2种方法,一是在“多重响应”子菜单下,一是在“表”子菜单下。前者属于base模块,相应的设定不能保存,不能在制表模块使用,后者属于table模块,且可保存在数据文件中重复使用,可用于所有制表过程。

    下面是使用第二种方法:

    3、问卷质量校验

    去除重复记录:

      步骤一:找出重复记录,步骤二:对重复记录进行处理。

    步骤一:

    步骤二:

    发现异常值:

      对于每个变量都有一定的取值范围,由于输入错误带来的异常值要在分析前进行处理。

      通过观察该变量的频率分布(分析-描述统计-频率)来识别异常值,通过“选择个案”来删除异常值。

    逻辑校验:

      如:个人收入大于家庭收入;未婚但有小孩等有违逻辑常识的。

      步骤一:通过制表方式查看是否存在逻辑问题(分析-表-设定表格)

      步骤二:对有违逻辑的个案进行处理。删除的话在“数据-选择个案”中处理。

    步骤一:

     4、问卷数据分析

     问卷加权:

      什么时候需要加权:样本的分布结构与总体结构不一致。如:总体男女比例为6:4,但样本问卷的男女比例为:7:3,此时需要对问卷数据赋予一定权重。

      加权思路:确定对结果有影响的变量-计算在该变量下的样本数量占比及权重-依据权重调整个案

    步骤一:按需加权的变量进分类汇总,并保存为新文件。

     步骤二:在新文件下,先计算总样本数,然后计算各类别的占比。即:各类别数/总样本数。

    数据-分类汇总

    转换-计算变量

    步骤三:手工录入总体占比,即:总体下的性别分布和教育水平分布。然后计算权重=总体占比/类别占比。

    计算权重在“转换-计算变量”中进行。

    步骤四:将该权重合并到问卷数据中。在此之前需要对问卷数据按这两个变量进行排序。

    排序:

    文件合并:

    步骤五:添加了权重变量后的问卷数据,要依据此权重进行数据加权。

    加权后的数据会在“数据视图”右下角有“加权范围”字样。

    业务分析:

      做各种交叉表进行业务分析,比如分析支付方式在性别上的分布,及性别对支付方式的影响。

      对单变量做频率分布,对相关变量做交叉表。

    分析-表-设定表

  • 相关阅读:
    Redis学习笔记
    RedisTemplate操作命令
    RedisTemplate操作命令
    RedisTemplate操作命令
    RedisTemplate操作命令
    将chrome储存的密码转为MarkDown表格
    使用redisson做redis分布式锁
    RocketMQ 整合SpringBoot发送事务消息
    关于java读写锁的测试
    java8 stream记录
  • 原文地址:https://www.cnblogs.com/yaofang/p/5606855.html
Copyright © 2020-2023  润新知