楼主: 040108020007
2455 5

[程序分享] 读入数据的问题 [推广有奖]

  • 0关注
  • 0粉丝

已卖:1份资源

讲师

12%

还不是VIP/贵宾

-

威望
0
论坛币
3437 个
通用积分
2.2500
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
7488 点
帖子
210
精华
0
在线时间
603 小时
注册时间
2007-6-25
最后登录
2025-12-29

楼主
040108020007 发表于 2010-10-26 16:26:35 |AI写论文
100论坛币
由于我之前发的帖子被沉下去了,再次发帖求助。

附件有数据,现在的问题是有部分内容的中间加入了回车符,使一条记录在2行显示,用外部读入法读入的时候就被当成2条记录读入了。
现在希望能解决这个问题,经过大家的帮助,我现在有2条思路。第一条是用input方式读入,可以解决回车的问题,有人帮写了代码如下:
data test;
   infile 'E:\样本.txt' lrecl=300 dlm='“,' dsd firstobs=2;
    input
                city :$6.
                quxian :$18.
                yingyeting : $42.
                staff_id : $10.
                staff_name : $33.
                SERIAL_NUMBER  
                RECOMM_DATE : $19.
                yewu : $18.
                qudao :$10.
                jieshou_flag :$6.
    ;
run;
这里有一个问题是,yingyeting这个变量中有逗号,这样有部分记录就会被拆散,后来我用逗号做分隔符,加入dsd选项,但第二行的引号却又被当做一个变量读入了。有点左右为难,哪位高手能在这方面给继续解决一下,不胜感激。

第二条思路是用函数compbl和compress组合将回车符拿掉,只可惜我才疏学浅,在读入阶段怎么用搞不清楚,哪位高手能用这个方法解决一下,小弟谢过了!

最佳答案

jiagangw 查看完整内容

1# 040108020007 filename dt 'D:\temp'; data tem; infile dt(Sample.txt) lrecl=400 truncover; input line $400.; file dt(S2.txt); if _n_ ne 1 then do; if length(compress(line,'"','K')) < 20 then do; input line2 $400.; line = trim(line)||' '||left(line2); end; end; output; put line; run; proc import datafile='D:\temp\S2.txt' out=dstn ...
关键词:读入数据 compress Number serial infile 记录 样本

沙发
jiagangw 发表于 2010-10-26 16:26:36
1# 040108020007

filename dt 'D:\temp';
data tem;
   infile dt(Sample.txt) lrecl=400 truncover;
   input line $400.;
   file dt(S2.txt);
   if _n_ ne 1 then do;
      if length(compress(line,'"','K')) < 20 then do;
      input line2 $400.;
         line = trim(line)||' '||left(line2);
         end;
   end;
   output;
   put line;
run;
proc import datafile='D:\temp\S2.txt' out=dstnm dbms=csv replace;
run;   

以上程序仅针对所提供的文本文件,若更多的行对应一个观测可相应地修改程序


P1.txt (412 Bytes)
已有 3 人评分经验 学术水平 热心指数 信用等级 收起 理由
peijiamei + 100 + 5 + 5 + 5 精彩帖子
040108020007 + 1 + 1 精彩帖子
pobel + 1 + 1 + 1 好的意见建议

总评分: 经验 + 100  学术水平 + 7  热心指数 + 7  信用等级 + 6   查看全部评分

藤椅
peijiamei 发表于 2010-10-26 17:41:20
我的微博:http://t.sina.com.cn/1087192374
欢迎互相加关注!

板凳
pobel 在职认证  发表于 2010-10-27 17:28:25
2# jiagangw

jiagangw 前辈的代码真是精彩! 此致敬礼!

一直在想怎样通过一个DATA步实现,通过学习前辈代码,现在终于实现了:

data test;
   infile "c:\files\test.txt" lrecl=400 dsd dlm="," truncover firstobs=2;
   length temp $400;
   input @ ;
   temp=_infile_;
   do while (length(compress(temp,'"','K')) < 20);
      input;
   input @;
        temp= cats(temp,_infile_);
   end;
   _infile_=temp;
   keep city--jieshou_flag;
    input @1
                city :$6.
                quxian :$18.
                yingyeting : $42.
                staff_id : $10.
                staff_name : $33.
                SERIAL_NUMBER  
                RECOMM_DATE : $19.
                yewu : $18.
                qudao :$10.
                jieshou_flag :$6.
    ;
run;
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
peijiamei + 3 + 2 精彩帖子
040108020007 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 4  热心指数 + 3  信用等级 + 1   查看全部评分

和谐拯救危机

报纸
xiaosanmao 发表于 2010-10-27 19:09:56
这个莫非就是传说中的汪嘉冈老师?

地板
一诺9257 发表于 2010-10-27 19:54:13
这么厉害!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 02:38