一 洞悉一切,为仆先知
回归分析法力无边,只要使用得当,就可预测某些结果值。若与控制实验同时使用回归分析还能预测未来。
二 针对数据进行预测
1. 使用散点图:一种从多方面展现数据特点的快捷办法,只要数据涉及两种变量(两种变量成对出现并描述了数据中隐含的人或事就可同时放在散点图中),就该考虑使用散点图。散点图的根本在于寻找变量之间的因果关系。在R中,使用plot()函数来画散点图。
2. 平均值图是一种散点图,这种散点图显示出与X轴上的每个区间相对应的Y轴数值。平均值图有两种,每张图代表两种变量中的一种变量的平均值。
3. 回归线:回归线就是最准确地贯穿平均值图中的各个点的直线。
1)回归线有两种,一种是已知X求Y,一种是已知Y求X(与两种平均值图相对应)。
2)回归线并不一定是直线,只要有回归的意义就可以。
3)回归线对于具有线性相关特点的数据很有用。
4. 相关性,即两种变量之间的线性关系。
1)如要要呈现线性关系,散点图上的点就需要大致沿着直线分析。
2)只有具有线性相关特性的回归线才有很好的预测性。
3)相关性可以用相关系数进行量度,相关系数也叫r。r的范围为-1~0表示无相关性,1,-1表示两个变量完全相关。在R中可以使用cor()函数求两个变量的相关性
三 预测
1. 预测方程:利用线性方程对直线进行数学表述。y=a+bx
2. 回归目标:使用R创建一个回归对象,函数lm()。每当创建一个线性模型,R就会在记忆库里创建一个对象,这个对象具有一长串属性,其中包括回归方程的系数
3. 得到回归方程系数之后,便能确定回归方程,此时便可进行预测
4. 回归方程需补需要改变这个问题主要取决于问题类型。若是有充足、定性的理由相信回归分析师正确的,则可能永远不需要改变分析。若是数据不停发生变化,那就应该不停进行回归分析并善加利用:若回归分析师正确的,会得益;但要是现实改变、回归分析失败,也不至于影响业务。
四 总结回归分析的步骤
1.首先,为了讨论是否具有求解回归方程的意义,画出自变量和因变量的散点图
2.求解回归方程
3.确认回归方程的精度,即求解回归方程的系数
4.进行回归系数的检验
5.总体回归Ax+B估计
6.进行预测