前言
有空添加整理精确度等相关内容。
相关概念
绝对误差=|测量值-真实值|;
相对误差= \(\cfrac{\textbf{|测量值-真实值|}}{\textbf{真实值}}\) ,即绝对误差所占真实值的百分比;
典例剖析
年份 | \(2017\) | \(2018\) | \(2019\) | \(2020\) | \(2021\) | \(2022\) |
---|---|---|---|---|---|---|
市场规模 | \(35\) | \(44\) | \(58\) | \(70\) | \(88\) | \(100\) |
\(\Big[\)附参考公式:\(\bar{y}=59\),\(\sum\limits_{i=1}^5{x_iy_i}=1017\),线性回归系数为\(\widehat{b}=\cfrac{\sum\limits_{i=1}^n{(x_i-\bar{x})(y_i-\bar{y})}}{\sum\limits_{i=1}^n{(x_i-\bar{x})^2}}=\cfrac{\sum\limits_{i=1}^n{x_iy_i-n\cdot\bar{x}\cdot\bar{y}}}{\sum\limits_{i=1}^n{x_i^2-n\cdot\bar{x}^2}}\),\(\widehat{a}=\bar{y}-\widehat{b}\cdot\bar{x}\).\(\Big]\)
(1)若 \(2017\)\(\sim\) \(2021\) 年对应的代码依次为 \(1\)\(\sim\) \(5\),根据 \(2017\)\(\sim\) \(2021\) 年的数据,求用户规模 \(y\) 关于年度代码 \(x\) 的线性回归方程\(\hat{y}=\hat{b}x+\hat{a}\);
解: \(\bar{x}=\cfrac{1}{5}(1+2+3+4+5)=3\),\(\sum\limits_{i=1}^{5} x_{i}^{2}=1^{2}+2^{2}+3^{2}+4^{2}+5^{2}=55\)
\(b\)\(=\)\(\cfrac{\sum\limits_{i=1}^{5} x_{i} y_{i}-5\overline{x}\overline{y}}{\sum\limits_{i=1}^{5} x_{i}^{2}-5\overline{x}^{2}}\)\(=\)\(\cfrac{1017-5\times3\times 59}{55-5\times 3^{2}}\)\(=\)\(\cfrac{132}{10}\)\(=\)\(13.2\)
\(a=59-13.2\times3=19.4\),故所求的回归直线方程为 \(y=13.2x+19.4\) .
(2)把 \(2022\) 年的年份代码 \(6\) 代入(1)中求得的回归方程,若求出的用户规模与预测的用户规模误差不超过\(5\%\),则认为预测数据符合模型,试问预测数据是否符合回归模型?
解析:由(1)可知,线性回归方程为 \(y=13.2x+19.4\)
故当 \(x=6\) 时, \(y=13.2\times 6+19.4=98.6\),
则 \(\cfrac{100-98.6}{100}=1.4\%<5\%\), 故预测数据符合回归模型.