一切模型都是错误的,但其中一些是有用的。
数据分析的根本在于妥善分解问题、为数据套上适当的心智模型和统计模型、做出正确的判断,但并不保证次次得到正确答案。
1. 数据分析的模式:确认问题--》分解数据--》评估数据--》决策;如何提问获取需要的信息来确认问题非常关键
2. 检验你的理论:好的AB测试;没有任何统计数据是绝对准确的,比较是破解观察数据不准备的法宝,数据只有对比才有意义;
3. 寻找最大值:利用规划求解;设定公式及所有约束条件,求可行区域内的最大解
4. 数据图形化:数据图形化的根本在于正确比较
5. 假设检验:证伪法:通过每一条信息剔除基本不可能的假设;之后将各种因素之间建立正负相关性关联;每一条信息分别给各个假设赋正负值,拥有最大值的假设是最可能发生的;
6.贝叶斯统计:贝叶斯很神奇:若默认患感冒,检验结果为阳性的概率为90%,或未患感冒,检验结果为阳性的概率为9%;如果你检验结果为阳性,感冒的概率为多少(1%的人患了感冒)。比如大家都认为A非常可能发生,突然收到消息说A很可能不发生;这是的做法不是让所有人重新评估A发生的概率,而是评估A如果发生收到这条消息的概率和A不发生收到这条消息的概率,之后利用贝叶斯进行计算。
7.主观概率:将直觉固化为主观概率数据;用标准偏差确定分歧大小;
8. 启发法:你是凭冲动做决定,还是凭几个精心选取的关键数据做决定?或是构建一个包含所有变量的模型,然后得出最佳答案?