请选择 进入手机版 | 继续访问电脑版
楼主: Imasasor
4975 4

求大神帮忙导入一个CSV文件 [推广有奖]

  • 1关注
  • 64粉丝

VIP

学科带头人

34%

还不是VIP/贵宾

-

TA的文库  其他...

超哥喜欢的文章

威望
1
论坛币
47033 个
通用积分
3.1376
学术水平
238 点
热心指数
246 点
信用等级
231 点
经验
36200 点
帖子
866
精华
3
在线时间
2234 小时
注册时间
2012-7-4
最后登录
2023-9-20

初级学术勋章 初级热心勋章 初级信用勋章 中级热心勋章 中级学术勋章

Imasasor 发表于 2014-10-21 11:01:24 |显示全部楼层 |坛友微信交流群
1000论坛币
1.rar (149.05 KB) 本附件包括:
  • 1.csv


表面上是一个CSV,逗号分隔符的文件,导入后发现全部变量都是字符型,后来打开看,里面的分隔符是一个逗号加一个Tab, 所以想着在import 时把delimiter写成了'2C09'x,表示逗号和Tab都是分隔符,可是这样导入,仍然全部是字符型变量,而且无法让两个分隔符示为一个分隔符

求大神帮忙看一下

要求:全数字的变量导入为数值格式,年月日导入日期格式,能够在proc import中让系统自动识别类型,不要在data, infile,input中一个个手动写变量的类型

非常感谢,些许论坛币,聊表心意


最佳答案

ziyenano 查看完整内容

data _null_; infile "d:\1.csv" _infile_=x lrecl=32767; file "d:\2.csv" lrecl=32767; input; x=compress(x,'"','s'); put x; run; 上面代码可以把引号和空白符去掉,导出到其他文件中,再用proc import导入。 但是proc import有个缺点,总是根据前面几行就确定了该字段的格式, 所以有可能确定了数值格式,后续出现的字符值就会报错,另外,文件中好像有字段名是相同的。 倒不如用Excel打开csv,转成Excel格式导入 ...
关键词:delimiter delimit import infile Input import 年月日 而且
欢迎加入亚太地区第一R&Python数据挖掘群: 251548215;
ziyenano 发表于 2014-10-21 11:01:25 |显示全部楼层 |坛友微信交流群
data _null_;
infile "d:\1.csv" _infile_=x lrecl=32767;
file "d:\2.csv" lrecl=32767;
input;
x=compress(x,'"','s');
put x;
run;
上面代码可以把引号和空白符去掉,导出到其他文件中,再用proc import导入。
但是proc import有个缺点,总是根据前面几行就确定了该字段的格式,
所以有可能确定了数值格式,后续出现的字符值就会报错,另外,文件中好像有字段名是相同的。

倒不如用Excel打开csv,转成Excel格式导入,不过要批量处理,这个办法就不行了。

使用道具

420948492 发表于 2014-10-21 12:27:47 |显示全部楼层 |坛友微信交流群
你这个存在几个问题
一是CSV文件为逗号分隔符文件,这是SAS系统认定的,你的是表示逗号和Tab都是分隔符,

二是CSV文件中由于不像在EXCEL中每个单元都有格式,所以也无法判断是否是日期

使用道具

Imasasor 发表于 2014-10-21 13:08:21 |显示全部楼层 |坛友微信交流群
420948492 发表于 2014-10-21 12:27
你这个存在几个问题
一是CSV文件为逗号分隔符文件,这是SAS系统认定的,你的是表示逗号和Tab都是分隔符,
...
用TXT打开看,其实是逗号和Tab两个分隔符,分隔开的

使用道具

lwien007 发表于 2014-10-23 10:55:17 |显示全部楼层 |坛友微信交流群
你这个导入和分隔符没什么关系,默认sas9.3可以正确导入数据,主要问题是你的数据文件中,每个变量用引号包含,所以导入会全部是字符型。另外数据不可能导入后就按照你的要求字符型,数值型,日期型都对应好,尤其是你变量这么多的情况,后续整理也很重要。个人觉得你的数据不如先按字符型导入,然后利用宏批量修改,批量修改也很方便,应该比你这个考虑直接导入成你想要的格式方便的多。还有如果变量字符数值都有确实可能会出现楼上说的丢失字符型数据的情况,不如直接字符导入,不会出现丢失数据的情况。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 10:10