楼主: liyichen17
3581 18

[问答] SAS中日期数据的清洗 [推广有奖]

  • 4关注
  • 1粉丝

讲师

3%

还不是VIP/贵宾

-

威望
0
论坛币
5 个
通用积分
1.0166
学术水平
4 点
热心指数
5 点
信用等级
2 点
经验
19465 点
帖子
165
精华
0
在线时间
602 小时
注册时间
2012-2-28
最后登录
2022-12-20

楼主
liyichen17 在职认证  发表于 2014-10-17 09:12:44 |AI写论文
50论坛币
我的数据已经导入到SAS文件中,数据量大概3000W条数据,30G大小。在日期那一栏中,有各种日期格式,还有各种样式乱码。
我想将乱码替换成缺失值,日期统一格式。
序号 日期格式
1  2013-01-01 00:00:00
2 2013-01-01
3  2013-1-1
4  2012.01.01
5  2012.1.1
6 2013/01/01
7  2013/1/1
8  20120101
9 18991231(乱码)

最佳答案

jingju11 查看完整内容

AS suggested, all the (in)formats you listed can be read in ANYDTDTEw. informats in SAS. 考虑到SAS 对此的解释并不完善, I had 3 summary blogs about this informat. 当然,如果对应我所提供的表格,请告诉我任何的遗漏之处. http://blog.sina.com.cn/s/blog_a3a926360102v3bx.html jingju
关键词:日期数据 缺失值 清洗

沙发
jingju11 发表于 2014-10-17 09:12:45
AS suggested, all the (in)formats you listed can be read in ANYDTDTEw. informats in SAS. 考虑到SAS
对此的解释并不完善, I had 3 summary blogs about this informat.
当然,如果对应我所提供的表格,请告诉我任何的遗漏之处.

http://blog.sina.com.cn/s/blog_a3a926360102v3bx.html

jingju

藤椅
zhengbo8 发表于 2014-10-17 11:03:50
先对日期变量运行一下proc freq.截图上来,我们才知道您的日期格式有多少种。
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
liyichen17 + 5 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 5  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

板凳
liyichen17 在职认证  发表于 2014-10-17 11:16:21
zhengbo8 发表于 2014-10-17 11:03
先对日期变量运行一下proc freq.截图上来,我们才知道您的日期格式有多少种。
3000万条数据,freq的话SAS要跑很久,而且可能会有上万条的格式。。。

报纸
zhengbo8 发表于 2014-10-17 12:20:07
那在数据集中,日期变量是什么类型,字符还是数值?
确认了我才好想办法。

地板
liyichen17 在职认证  发表于 2014-10-17 13:25:07
zhengbo8 发表于 2014-10-17 12:20
那在数据集中,日期变量是什么类型,字符还是数值?
确认了我才好想办法。
那一列是字符型,有各种日期格式还有各种形式乱码,多谢。

7
lwien007 发表于 2014-10-17 14:17:54
可能要有上万种格式,时间再长也得列出来各种格式,格式都不知道有什么怎么整理。

8
liyichen17 在职认证  发表于 2014-10-17 15:59:48
lwien007 发表于 2014-10-17 14:17
可能要有上万种格式,时间再长也得列出来各种格式,格式都不知道有什么怎么整理。
大概有这几种分类方式:
2013/01/01
20121305
2013-01-01
2013-01-01 00:00:00
2013-1-1
2013/1/01
2012.01.01
2012.1.1
18991231(乱码)

9
pobel 在职认证  发表于 2014-10-17 16:09:08
liyichen17 发表于 2014-10-17 15:59
大概有这几种分类方式:
2013/01/01
20121305
20121305  是 年-日-月的格式?
18991231在SAS中可以按照YYMMDD8.的informat正常读入。

10
liyichen17 在职认证  发表于 2014-10-17 16:24:00
pobel 发表于 2014-10-17 16:09
20121305  是 年-日-月的格式?
18991231在SAS中可以按照YYMMDD8.的informat正常读入。
20121305 这个是写错了,应该20121205,像这种各种日期格式都在一列,是否都可以按照YYMMDD8.的格式读入?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 16:34