• R_Studio(学生成绩)对数值型数据进行统计量分析


      对“Gary.csv”中的成绩数据进行统计量分析

     基础数据分析

      均值 中位数 极差   标准差   变异系数 1/4分位数 3/4分位数 四分位间距... ...分析

    setwd('D:\data')                            #更改工作目录
    list.files()                                #列出当前工作目录下的文件
    dat=read.csv(file="Gary.csv",header=TRUE)    #读取"Gary.csv文件"
    
    dats=dat[,3]     #对大学体育成绩进行分析
    
    # 统计量分析
    #平均分
    mean_ = mean(dats,na.rm=T)
    # 中位数
    median_ = median(dats,na.rm=T)
    # 极差
    range_ = max(dats,na.rm=T)-min(dats,na.rm=T)
    # 标准差
    std_ = sqrt(var(dats,na.rm=T))
    # 变异系数
    variation_ = std_/mean_
    # 四分位数间距
    q1 = quantile(dats,0.25,na.rm=T)
    q3 = quantile(dats,0.75,na.rm=T)
    distance = q3-q1
    a=matrix(c(mean_,median_,range_,std_,variation_,q1,q3,distance),1,byrow=T)
    colnames(a)=c("均值","中位数","极差","标准差","变异系数","1/4分位数","3/4分位数","四分位间距")
    print(a) 
    Gary.R

     平均值mean(x, trim = 0, na.rm = FALSE, ...)  传送门

       x - 是输入向量。

      trim - 用于从排序的向量的两端删除一些观测值。

        na.rm - 用于从输入向量中删除缺少的值。

    中位数median(x, na.rm = FALSE) 

       x - 是输入向量。 

      na.rm - 用于从输入向量中删除缺少的值。

    其它数据分析方法  

      线性回归  传送门

      多元回归

      逻辑回归

      正态分布  传送门

      二项分布  传送门

      泊松回归  传送门

      协方差分析

      时间序列分析

      非线性最小二乘法

      决策树  传送门

      随机森林

      生存分析卡方检验

    (如需转载学习,请标明出处)
  • 相关阅读:
    JS中检测数据类型的方式
    DOM库
    原型应用(将数组去重写到数组的原型上)
    JS学习之原型和原型链模式
    JS学习之闭包、this关键字、预解释、作用域综合
    JS学习之作用域
    JS学习之预解释
    maven gradle 混合使用的问题
    libgdx 开发环境搭建
    maven 安装 jar
  • 原文地址:https://www.cnblogs.com/1138720556Gary/p/9651354.html
Copyright © 2020-2023  润新知