直线相关与回归分析
双变量计量资料中的总体是什么?
是所有的变量,每一个变量是一个变量值组(a,b)。
协变关系是什么?
一个变量变化之后另外一个变量跟着变化。
平行关系在哪里?
散点图中的正向协同变化是什么?散点图中的负向协同变化是什么?
都是两个变量之间关系的定性描述:
定量描述是:相关和回归
因果关系是什么?
就是回归关系,每一个x对应一个唯一的y的分布eg :相同身高下有一个体重的分布此时,身高是一个固定因素,比如160cm,165cm其值没有误差是一个离散变量,而体重是一个分布,也就是说所有误差都在体重上,是一个连续变量。或者,相同体重下有一个身高的分布时,体重是一个固定因素,比如60kg,65kg其值没有误差是一个离散变量,而身高是一个分布,也就是说所有误差都在身高上,是一个连续变量。
直线回归的假设检验检验的是什么?
对估计出的参数进行估计,凡是估计出来的值都需要假设检验。
直线回归数学模型与直线函数数学模型的区别是什么?
直线回归数学模型多了一个随机变量的参数
直线回归方程和直线回归数学模型是一样的吗?
不一样:
直线回归方程:
直线回归数学模型:
计算回归方程的简单方法:
回归方程的前提是?
x是没有误差的固定变量,或其误差可以忽略,而y是随机变量,且有随机误差。
每一个x对应一个唯一的y的分布eg :相同身高下有一个体重的分布此时,身高是一个固定因素,比如160cm,165cm其值没有误差是一个离散变量,而体重是一个分布,也就是说所有误差都在体重上,是一个连续变量。或者,相同体重下有一个身高的分布时,体重是一个固定因素,比如60kg,65kg其值没有误差是一个离散变量,而身高是一个分布,也就是说所有误差都在身高上,是一个连续变量。
回归平方和和离回归平方和是什么?
一个是受到回归分析造成的差异,因为x平均值对应的是y平均值,而x对应的是y的预测值,两者是不同的x对应的不同的y,这是因为回归方程造成的,所以该差异就是斜率的一个反应,斜率越大回归效果越好,回归效果就是被拉回平均值的效果。
直线回归分析中的自变量如何决定?
回归自由度看自变量的个数,eg:看x-y形式的就是1
离回归标准差,回归估计标准误,剩余标准差都是什么?
都是离回归标准差。
对于回归系数β有几种检验方法?
基于不存在回归关系,理解一:所有y的分布都是相同均值的;理解二:估计出的回归方程来自的数学模型中的β=0
- F检验,H0所有y的分布都是相同均值的。2.t检验,估计出的回归方程中的β=0
什么是内插(interpolation什么是外延(extrapolation)?
在自变量范围内求出的估计值,一般称为内内插(interpolation);超过自变量取值范围所计算出的估计值,称为外延(extrapolation)。