1.大纲
什么是回归分析
什么是线性回归
线性回归的特点与基本假设
构建线性回归模型
一:基本概念
1.回归
回归是处理两个或者两个以上的变量之间互相依赖的定量关系的一种统计方法和技术。
变量之间的关系并非确定的函数关系,但是通过一定的概率分布来描述
2.线性与非线性
线性:严格定义是一种映射关系,存在可加性与齐次性
非线性:不满足线性。
3.线性回归
在回归分析中,如果自变量与因变量存在线性关系,则成为线性回归。
若果一个自变量一个因变量,则是一元线性回归
如果是一个因变量,多个自变量,则是多元回归
4.回归模型的一般形式
回归模型的一般形式:
5.线性回归的前置假设条件
二:建立回归模型
1.流程
需求分析明确变量:明确场景,清楚需要解释的指标(因变量),然后选取与之有关的变量作为解释变量(自变量)
数据收集加工:根据上一步分析得到的解释变量,收集相关的数据(时序数据,截面数据),得到的数据进行清洗,加工,并根据数据情况调整解释变量,判断是否满足基本假设
确定回归模型:了解数据集,根据结果选择回归模型
模型参数估计:最常用的方法是最小二乘法,在不满足基本假设的情况下还会才去岭回归,主成分回归,偏最小二乘法等
最小二乘法:最小平方法,通过最小化误差的平方和和寻找数据的最佳函数匹配的方法。
模型检验优化:参数确定后,得到模型。这个时候需要对模型进行统计意义上的检验,包括回归方程的显著性检验,回归系数的显著性检验,拟合度检验,异方差检验,多重共线性检验等。还需要根据结合实际,判断该模型是否具有实际意义。
三:回归模型的特点