• 回归分析


    2017/6/23 19:03:33

    一、概述

    回归分析统计方法研究变量之间的关系并对其构建模型。回归的应用领域广泛,几乎遍及所有学科。

    在几乎所有的回归领域中,回归方程只是实际函数关系的逼近。实际的函数关系通常以人们对理论中潜在机理的了解为基础产生的,这类模型称之为机理模型。而回归分析却不同,人们将其视为经验模型

    (一) 由来

    英国统计学家 F.Galton 和他的学生 K.Pearson 在研究父母身高与其子女身高的遗传问题时,将每对夫妇的平均身高作为 x(单位:英寸),而取他们的一个成年儿子的身高作为 y,将结果在平面直角坐标系上绘成散点图,发现趋势近乎一条直线。计算出的回归直线方程为

    Galton 引入了“回归”这个名词来描述父辈身高 x 和子代身高 y 的关系。

    从 1809 年,Guass 提出最小二乘法算起,回归分析的历史已有二百年,它所研究的内容已十分丰富,主要包括

    • 线性回归
    • 回归诊断
    • 回归变量的选择
    • 参数估计方法的改进
    • 非线性回归
    • 含有定性变量的回归
    • 非参数回归

    (二) 回归模型的一般形式

    如果变量 与随机变量 y 之间存在相对关系,通常意味着每当 取定值之后,y 便有相应的概率分布与之对应,即

    其中,随机变量 y 称为被解释变量(因变量), 称为解释变量(自变量),ε 为随机误差 为一般变量 的确定性关系。当 时候,我们称之为“线性回归”。

    (三) 模型适用性检验

    回归分析的下一阶段称为模型适用性检验。模型适用性检验研究模型的适当程度,确定拟合质量的高低。模型适用性检验有两种可能的结果,要么表明模型是合理的,要么表明我们必须修正原来的拟合方案。因此,回归分析是一个反复的过程。

    二、一元线性回归

    (一) 数学形式

    考虑以下式子

    假定 ,那么有

    我们称上式为回归方程。

    回归分析的主要任务就是通过 n 组观测值 进行估计。一般使用 分别表示 的估计值,则称

    为 y 关于 x 的一元经验回归方程

    (二) 回归参数 的估计

    下面使用普通最小二乘估计(ordinary least squares estimate, OLSE),进行参数估计。

    的估计(),称

    残差。残差刻画了在一个样本点上估计值与实际值的偏差,而残差平方和 Q

    则是从整体上刻画 n 个样本观测点到回归直线距离的 大小。

    使得残差平方和 Q值最小的那一组 便是回归参数 的最小二乘估计,即

    根据微积分中求极值的原理,应满足下列方程组

    解得

    其中,

    (三) 斜率和截距的假设检验

    由于误差 ...

    三、多元线性回归

    对于上面的式子,我们假设

    于是,我们得到

    残差平方和 Q

    最小二乘估计量必须满足

    ...(未完)

    参考文献

    [1] 何晓群,闵素芹. 实用回归分析(第二版). 高等教育出版社. 2014
    [2] 道格拉斯 C.蒙哥马利等. 线性回归分析导论[M]. 王辰勇 译. 机械工业出版社. 2016.

  • 相关阅读:
    VS2010运行正常的控制台程序在VS2015中出现乱码的解决方法
    把博客园的博客导出为MovableType的文本格式
    2015年全年总结
    2015年第21本:万万没想到,用理工科思维理解世界
    2015年第20本:零秒思考
    参加2015年TOP100会议的零散笔记
    2015第19本:异类--不一样的成功启示录
    在IntelliJ IDEA14中安装go语言插件
    2015第18本:从0到1,ZERO to ONE, Notes on startups, or how to build the future
    2015第17本:脑力活化术
  • 原文地址:https://www.cnblogs.com/super-zhang-828/p/7071422.html
Copyright © 2020-2023  润新知