线性回归分析过程中可能会遇到的问题
选定自变量时候要注意:去除多重共线性干扰
什么是多重共线性干扰?
强相关变量
多重共线性
避免将两个强相关变量输入到一个模型中,解决办法是只保留一个。
消除多重共线性的方法:
如果GVIF>10 则需要调整
如何挑选输入模型的自变量
输入的自变量多是有好处的,能够提升回归模型的准确性。另一方面,建设输入的自变量也是有好处的,可以方便业务同事理解。
权衡自变量多少的标准:
用olsrr包的ols_all_possible()函数
以上数据都计算出来后就可以创建线性回归模型