使用如下语句导入:
- proc import datafile='filename.txt' out=cdr.mdr dbms=dlm replace;
- delimiter='|';
- getnames=yes;
- run;
- note:在第XX行、第XX列有对XX变量无效的数据
在对某些变量如Remedial Action进行分析时,发现了问题。按照下载页面说明,此变量值分为RC、RP、RL、RB、OT、NO、IN、PM、MA、*等几种,但统计出的频数表分类却不是这几种,说明读入的数据库值有误。
我自己猜测log中的提示是因为某些变量值过长,读入的时候被截断了。
搜索了论坛中相关的帖子,如https://bbs.pinggu.org/thread-1214883-1-1.html,提供解决方法为导入后利用log中的代码,修改informat 及format的长度。但在这里不太可行,因为不知道每个变量的长度究竟是多少。
后来查了sas base guideline,知道proc import有个选项guessingrows=,可以指定要扫描的观测行数,能避免长值被截断,不过SAS9.2里好像guessingrows选项最大值只能到32767(貌似9.3支持到2147483647,但现在我用的还是9.2)。
希望各位老师和同仁能指点一二,log的提示是否是因为长度的关系?有没有比较方便的解决方法?



雷达卡





京公网安备 11010802022788号







