概述
现代统计分析包括两个部分,描述性统计和统计推断。
描述性统计包括数值型描述统计和图表型描述统计。数值型描述统计包括集中趋势和变异程度,集中趋势包括均值、中位数、众数等,变异程度包括标准差、方差、四分位距等;图表型描述包括条线饼点箱等,我比较喜欢箱型图。
统计推断包括参数估计和假设检验,前者基于大概率,后者基于小概率。抽样和概率分布是统计推断的基础;参数估计包括点估计和区间估计;很多统计推断方法则都是基于假设检验的,只是用的统计量不一样。也有一些不是利用样本推断总体的变量分析方法,比如时间序列预测、聚类、主成分分析等。
知识图谱
统计分析方法知识图谱具体如图,具体更完全版等后续攻克完再重新整理。
[1]
学习路径
基本所有统计书籍都是描述性统计——概率和概率分布——假设检验——各种统计推断方法——非样本推断总体的变量分析方法。
可以说路线是非常长了,我也是经历过好多次这样的过程,所以到假设检验这里就先不管了,从后两方面入手。
其中市面上提及比较多的统计分析模型包括:
时间序列预测模型
回归模型
聚类分析
主成分分析
因子分析
Logistic回归
方差分析
另外常用数据挖掘模型包括:
聚类分析
关联分析
神经网络
决策树
其他统计分析模型包括:
t检验
卡方检验
判别分析
多维尺度分析
对应分析
信度分析
等等
——所以,一个一个认真学吧,想哭
[1]《SPSS20.0统计分析方法基础教程初+中高阶》.张文彤