• 复杂统计方法R语言——简单回归


    简单回归

    数据来源:http://www.statsci.org/data/general/cofreewy.html

    1.读入数据

    setwd("D:/数学建模/寒假美赛集训/R统计")
    w=read.table("COfreewy.txt",header=T,encoding = "utf-8")
    

    2.线性回归

    a=lm(CO~.,w)
    #a=lm(CO~Traffic+Wind,w)#线性回归
    #print(w)
    summary(a)

     第一列为回归系数,第二列为标准差,一般都<0.05较好,第四列为p值。原假设为:系数为0。p<0.05,则拒绝原假设。若p>0.05,可以考虑去除该变量再做一次回归,以使每一个p值都<0.05。

    3.AIC逐步回归

    b=step(a,direction = "backward")#逐步回归
    summary(b)

    通过使用逐步回归,我们选择了变量,舍弃了Hour变量,每一个p值都<0.05。

    4.残差检验

    shapiro.test(b$res)#做残差的正态性检验

     $y-hat{y}$为残差,应符合正态分布,均值为0。如果均值不为0,则存在系统误差。

    5.画出qq图

    qqnorm(b$res);qqline(b$res)#查看回归残差的qq图

    qq图有两个作用:1、检验一组数据是否服从某一分布。2、检验两个分布是否服从同一分布。qq图全称是quantile-quantile plot,从名称中可以了解到是和分位数相关的图。qq图没有过原点,说明仍存在一定系统误差。

     

    6.各变量散点图

    plot(w)
    #pairs(w)

    7.傅里叶技术变换

    cor(cbind(CO,Traffic,Tsq=Traffic^2,Tcub=Traffic^3,
              Hour,Hsq=Hour^2,Hcub=Hour^3,Wind,Wsq=Wind^2,Wcub=Wind^3))
    a=lm(CO~Traffic+Wind+I(Wind^2)+I(Wind^3)+sin((2*pi/24)*Hour)+
      cos((2*pi/24)*Hour)+sin((4*pi/24)*Hour)+cos((4*pi/24)*Hour))
    b=step(a) #逐步回归,按照aIC选择变量
    summary(b);anova(b);shapiro.test(b$res)
    
    b1=lm(CO~Traffic+Wind+I(Wind^2)+
            cos((2*pi/24)*Hour)+cos((4*pi/24)*Hour))
    summary(b1)
    anova(b1)#方差分析表
    shapiro.test(b1$res)#对残差的正态性检验
    qqnorm(b$res);qqline(b$res)#查看回归残差的qq图

     

     所有代码:

    setwd("D:/数学建模/寒假美赛集训/R统计")
    w=read.table("COfreewy.txt",header=T,encoding = "utf-8")
    attach(w)#把数据变成全局变量
    print(CO)
    head(w)#查看前6条数据
    a=lm(CO~.,w)
    #a=lm(CO~Traffic+Wind,w)#线性回归
    #print(w)
    summary(a)
    
    b=step(a,direction = "backward")#逐步回归
    summary(b)
    
    shapiro.test(b$res)#做残差的正态性检验
    
    qqnorm(b$res);qqline(b$res)#查看回归残差的qq图
    
    par(mfrow=c(2,3))#同时显示6张图
    plot(Traffic,Wind)
    plot(CO,Wind)
    plot(Traffic,CO)
    plot(Hour,Wind)
    plot(CO,Hour)
    plot(Hour,Traffic)
    plot(w)
    #pairs(w)
    
    cor(cbind(CO,Traffic,Tsq=Traffic^2,Tcub=Traffic^3,
              Hour,Hsq=Hour^2,Hcub=Hour^3,Wind,Wsq=Wind^2,Wcub=Wind^3))
    a=lm(CO~Traffic+Wind+I(Wind^2)+I(Wind^3)+sin((2*pi/24)*Hour)+
      cos((2*pi/24)*Hour)+sin((4*pi/24)*Hour)+cos((4*pi/24)*Hour))
    b=step(a) #逐步回归,按照aIC选择变量
    summary(b);anova(b);shapiro.test(b$res)
    
    b1=lm(CO~Traffic+Wind+I(Wind^2)+
            cos((2*pi/24)*Hour)+cos((4*pi/24)*Hour))
    summary(b1)
    anova(b1)#方差分析表
    shapiro.test(b1$res)#对残差的正态性检验
    par(mfrow=c(1,1))
    qqnorm(b$res);qqline(b$res)#查看回归残差的qq图
    

      

      

  • 相关阅读:
    已解决[Authentication failed for token submission,Illegal hexadecimal charcter s at index 1]
    远程快速安装redis和远程连接
    远程快速安装mysql
    Swiper的jquery动态渲染不能滑动
    微服务架构攀登之路(三)之gRPC入门
    微服务架构攀登之路(二)之RPC
    微服务架构攀登之路(一)之微服务初识
    Go语言中new和make的区别
    Go语言实战爬虫项目
    Go语言系列(十一)- 日志收集系统架构
  • 原文地址:https://www.cnblogs.com/caiyishuai/p/12200220.html
Copyright © 2020-2023  润新知