1. DATE 处理
1.1 日期格式一个是as.Date(XXX) 和strptime(XXX),前者为Date格式,后者为POSIXlt格式
1.2 用法:as.Date(XXX,"%Y/%m/%d %H:%M") ,strptime(XXX, format="%m%d%Y %H:%M")
1.3格式里的Y 为yy(i.e.: 15/01/02) , 格式里的y为yyyy(i.e.:2015/01/02)
2. 一些常用属性
2.1 输出列名:colnames()
2.2 过滤:subset(xxx,xxx$yyy==??) 或者 abc<-abc[abc$x>5,]
2.3 升序,降序为列前加负号:a[order(a[,1]),]
2.4 包含型过滤:a[a$Group.2 %in% c("PO. Manual Miss","Product Issue"),] # in需要加%%
2.5 聚合函数:aggregate(x,by=list(),FUN) #length = count,sum=sum,average=mean
2.6 返回文件名:dir(".",pattern = "*txt$")
3. 字符串处理
3.1 连接字符串paste(X,Y,sep="")
3.2 字符数量:nchars
3.3 分割字符串:strsplit(x,split="") ##返回类型为LIST
4.数据框和因子
4.1 merge(data.frame,data.frame,all=T) # full join 效果
4.2 factor(wm$Product.Version,levels=c("Before Everest ","Everest","Pluto","Pluto Patch","7004","7005")) #因子排序
4.3 rbind要注意学需要bind的列名必须一致否则会报名字同原来已有的名字不相对
4.4 levels(x) # 输出所有因子
推荐几个比较好用的R语言学习论坛:
http://www.nabble.com/ /*英文的R语言论坛,基本上都能找到相关的提问*/
http://cos.name/cn/ /* 统计之都,大家都懂的 */