问题:有4个TXT文件,每个文件中1个数值变量,共5个观测(如1 2 3 4 5),数据分析前,需要先用循环语句对这几个文件的数据预处理,然后用SAS语句读取文件。
解决:
1 data temp;
2 do in=1 to 4;
3 fname=cats('c:',in,'.txt');
4 do until(last);
5 infile XXX filevar=fname end=last;
6 input v;
7 output;
8 end;
9 end;
10 stop;
11 run;
2 do in=1 to 4;
3 fname=cats('c:',in,'.txt');
4 do until(last);
5 infile XXX filevar=fname end=last;
6 input v;
7 output;
8 end;
9 end;
10 stop;
11 run;
注意:
1.DO循环:很巧妙的注意到了C盘下TXT文件名的规律性,都是一个数字命名的文件名,用变量IN,采用CATS字符串连接函数,循环创建D盘下的TXT文件名变量FNAME;
2.在读取文本数据时,很多人都知道用INFILE,以及INFILE基本参数,XXX是文件名,filevar是打开或者关闭指定的文件名,end=last是定义一个变量了解是否读到文件的结尾处,这里的LAST与until里面的last保持一致
3.STOP,这里为什么用STOP,这个很重要,如果去掉STOP,那么就会无线循环下去。所以当我们在DATA步里面制定读取的数据是以随机方式读取的时候,例如这个里面的IN,或者是在SET里面的POINT等,需要用STOP。Because SAS does not detect an end-of-file with this access method, you must include program statements to prevent continuous processing of the DATA step.