• R语言实战读书笔记(二)创建数据集


    2.2.2 矩阵

    matrix(vector,nrow,ncol,byrow,dimnames,char_vector_rownames,char_vector_colnames)

    其中:

    byrow=TRUE/FALSE,表示按行填充还是按列填充,默认情况下是按列填充

    2.2.4 数据框

    1.attach,detach()和with()

    attach():将数据框加入搜索路径

    detach():将数据框移除出搜索路径

    with():赋值仅在括号内有效,如果想在括号外生效也可以,用<<-

    2.2.5 因子

    因子:名义型变量和有序型变量,会将此类变量都对应一个整数值

    factor():生成因子向量,ordered=TRUE后为有序变量,levels参数是覆盖默认排序,可以指定有序变量对应整数值的顺序

    用法:

    patientID <- c(1, 2, 3, 4)
    age <- c(25, 34, 28, 52)
    diabetes <- c("Type1", "Type2", "Type1", "Type1")
    status <- c("Poor", "Improved", "Excellent", "Poor")
    diabetes <- factor(diabetes)  #会被编成1 2 1 1
    status <- factor(status, order = TRUE)  #会被编成3 2 1 3
    patientdata <- data.frame(patientID, age, diabetes, status)
    str(patientdata)  #str是显示对象结构,可以展示出来被编码成什么
    summary(patientdata)

    2.2.6 列表

    g <- "My First List"
    h <- c(25, 26, 18, 39)
    j <- matrix(1:10, nrow = 5)
    k <- c("one", "two", "three")
    mylist <- list(title = g, ages = h, j, k)
    mylist

    2.3.2 从带分隔符的文本文件导入数据

    read.table(file,header,sep,row.nanes),默认情况下,字符型变量都将转换为因子,可以设置stringsAsFactors=FALSE

    2.5 处理数据对象的实用函数,看完了机器学习实战觉得这些都是小儿科了

    length()

    dim():显示对象的维度

    str():显示对象的结构,R语言这个坑死的命名啊,str不是一般指string吗,这样就变成了structure

    class()

    names()

    cbind()

    rbind()

    head()

    tail()

  • 相关阅读:
    Know more about RAC statistics and wait event
    再谈指针
    Manageing Undo Data
    SQL基础内容
    JavaScript高级程序设计(3版)笔记分享( ES5特性)
    HTML5布局篇( 总结 )
    温习 SQL 01(Z)
    Makefile
    SQLPLUS工具简介
    链接相关 & 预处理
  • 原文地址:https://www.cnblogs.com/MarsMercury/p/4966219.html
Copyright © 2020-2023  润新知