字符串连接函数paste
1、字符串连接:paste(..., sep = " ", collapse = NULL)sep表示分隔符,默认为空格。collapse表示如果不指定值,那么函数paste的返回值是自变量之间通过sep指定的分隔符连接后得到的一个字符型向量;如果为其指定了特定的值,那么自变量连接后的字符型向量会再被连接成一个字符串,之间通过collapse的值分隔
(1) paste函数把它的自变量连成一个字符串,中间用空格分开,如
> paste("Hello","world") [1] "Hello world"
(2) 连接的自变量可以是向量,这时各对应元素连接起来,长度不相同时较短的向量被重复使用。如
> paste("A", 1:6, sep = "") [1] "A1" "A2" "A3" "A4" "A5" "A6"
(3) 如果希望将一个向量中所有字符连接在一起且中间用逗号分隔,使用paste(x,collapse)即可,结果只是返回一个元素。
> paste(letters[1:6],collapse=",") [1] "a,b,c,d,e,f"
(4) 同时使用了参数seq与collapse
> paste("A", 1:6, sep = "", collapse=",") [1] "A1,A2,A3,A4,A5,A6"
(5)如果只是希望向量x中每一个元素和特定的字符(如下划线_)连接,使用paste(x,seq=)即可,如
> paste(letters[1:4], seq='_') [1] "a _" "b _" "c _" "d _"
2、应用方面,以上说的还是paste的基础常用方式,下面说的是我经常会用到的paste用法,与学习的时候不同,paste其实用法挺灵活的。
(1) R读取数据的时候有时会读取多个文件如:a.csv b.csv c.csv,d.csv........等,这时可以用到paste来实现。
> path <- 'E:\mytestdata\' > setwd(path) > dir.data <- dir(path) > dir.data [1] "a.csv" "b.csv" "c.csv" "d.csv" >for(i in 1:length(dir.data)){ >data <- read.csv(paste(path,dir.data[i],sep='')) >}
循环读取文件,data分别表示 "a.csv" "b.csv" "c.csv" "d.csv",可以在循环里对每个文件进行操作
(2)R保存文件的时候也可以用paste
write.csv(a.csv,file=paste(path,'data.csv'))
(3) paste也可以连接sql语句
paste('select * from student where date =','date',sep=" ")
这样的好处是可以把date设置为外来参数,进行传参。
总结:虽然列举了不同的用法,但是本质就是字符串连接,只不过在实际中用法比较灵活,需要多加练习,用多了会觉得非常好用。
3、使用paste0连接多个字符串
> date1 <- 20150101 > date2 <- 20151231 > paste0("select * from sales where stat_date between ",date1," and ",date2) [1] "select * from sales where stat_date between 20150101 and 20151231"
dim(x)查看或设置数组的维度向量
> a <- matrix(1:20,nrow=5,ncol=4,byrow=T) > a [,1] [,2] [,3] [,4] [1,] 1 2 3 4 [2,] 5 6 7 8 [3,] 9 10 11 12 [4,] 13 14 15 16 [5,] 17 18 19 20 > is.matrix(a) [1] TRUE > dim(a) #查看或设置数组的维度向量 [1] 5 4 # 错误的用法 > dim(a) <- c(4,4) Error in dim(a) <- c(4, 4) : dims [product 16]与对象长度[20]不匹配 > # 正确的用法 > a <- 1:20 > dim(a) <- c(5,4) #转换向量为矩阵 > a [,1] [,2] [,3] [,4] [1,] 1 6 11 16 [2,] 2 7 12 17 [3,] 3 8 13 18 [4,] 4 9 14 19 [5,] 5 10 15 20
is系列和as系列函数用来判断变量的属性和转换变量的属性
> is.character(a) [1] FALSE > is.numeric(a) [1] TRUE > is.matrix(a) [1] TRUE > is.data.frame(a) [1] FALSE # 矩阵转换为data.frame > is.data.frame(as.data.frame(a)) [1] TRUE