注:这是一个横跨数年的任务,标题也可以叫做“从To Do List上划掉学习统计学”。在几年前为p值而苦恼的时候,还不知道Python是什么;后来接触过Python,就喜欢上了这门语言。统计作为数据科学的基础,想要从事这方面的工作,这始终是一个绕不过去的槛。
其实从中学就开始学习统计学了,最早的写"正"字唱票(相当于寻找众数),就是一种统计分析的过程。还有画直方图,求平均值,找中位数等。自己在学校里并没有完整系统的学习过概率论和数理统计,直到在工作中用到,才从最初的印象中,逐渐把这门学科与整个数学区分开来。自从认识到这门学科在自己从事的工作(数据分析)中所处的重要地位,真没少花时间在这方面的学习上。从最初的p值的含义,到各种分布,假设检验,方差分析。。。有的概念看过很多遍,但还是没有理解透彻;有的看过,长时间不用,又忘记了。总之,这一路走来,实在是崎岖坎坷。因此,打算在最近专门抽出一段时间对自己学习过的《概率论与数理统计》做一个小结,也算是对自己的一个交代。在这里放个目录,后面会不断更新。期待跟喜欢Python和数据分析的朋友一起交流,相互学习。
这个小结主要包括以下几个方面:
- 基本概念;
- Python的实现;
- 一些比较经典的例子。
概率论
01. 概率论中的基本概念
02. 随机变量概述
05. 随机变量的数字特征
数理统计
06. 大数定律及中心极限定理
07. 统计学中的基本概念
08. 三大抽样分布
10. 参数假设检验
11. 拟合优度检验(非参数假设检验)
12 方差分析
13. 回归分析
拾遗
A1. 全概率公式和贝叶斯公式
A2. 自由度(样本方差中的n-1)
A3. 数理统计中常用的符号
参考资料
中国大学MOOC:浙江大学,概率论与数理统计
中国大学MOOC:哈尔滨工业大学,概率论与数理统计
https://docs.scipy.org/doc/scipy/reference/stats.html
《概率论与数理统计》,陈希孺,中国科学技术大学出版社