R 语言似乎在WINDOWS平台上对中文的支持不是特别好,似乎是3.1.2的一个BUG。
目前我研究出了一个临时解决方案,你可以将代码编写成一个函数,从而在调用的过程中不必如下繁琐:
1. 先将本地语言集转换成English 1252:
Sys.setlocale(category="LC_ALL", locale = "English_United States.1252")
2. 将文件集以UTF-8的格式读入:
b<-read.csv(y,head=F,encoding="UTF-8",stringsAsFactor=F)
3.最后将本地语言集再转换成中文。
Sys.setlocale("LC_CTYPE", "Chinese")
值得注意的是上例中文件以UNICODE的字符集的形式存在,似乎对ANSI的字符集却不会有问题。我也闹不明白什么问题。