楼主: webgu
3941 3

[原创博文] SAS FORMATS基础和概述 [推广有奖]

贵宾

学科带头人

95%

还不是VIP/贵宾

-

TA的文库  其他...

Python与统计

SAS与统计

威望
2
论坛币
102549 个
通用积分
3.4687
学术水平
475 点
热心指数
493 点
信用等级
434 点
经验
62369 点
帖子
1555
精华
4
在线时间
2201 小时
注册时间
2009-5-4
最后登录
2025-12-25

初级学术勋章 初级热心勋章 初级信用勋章 中级学术勋章 中级热心勋章 中级信用勋章

楼主
webgu 发表于 2011-11-17 10:15:10 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

一篇很基础的介绍SAS FORMATS的豆腐块文章。

图文版:http://blog.sina.com.cn/s/blog_41889b900100wjz5.html or http://www.mysas.net/sns/index.php?app=blog&mod=Index&act=show&id=1885&mid=3570


文字版如下:

1、  什么是SAS FORMATS?

SAS的数据类型虽然只有数字(numeric)和字符(character)两种,但是这并不妨碍SAS 展示其在数据的读取、转换和展示上的高效、强大和灵活。我想原因之一,就是因为有了SAS FORMATS。什么是SAS FORMATS?简言而之,就是SAS 在读取或展示数据时的一些指令。更直白的说,就是SAS用来读取和展示数据的一些规则。

话说到此,我们也许会有疑问,平时读取和展示数据时,好像也没用到SAS FORMATS?

例如数据集test1,在读取时并没有指定什么格式,也没碰到什么麻烦,但How about数据集test2呢?


  1. data test1;

  2.    input pid $ price;

  3. datalines;

  4. p001 2239.5

  5. p002 456

  6. p003 231.4567

  7. ;

  8. run;


  9. data test2;

  10.     input pid $ price;

  11. datalines;

  12. d1 p001 $2,239.5

  13. d1 p002 $456

  14. d1 p003 $231.4567

  15. ;

  16. run;
复制代码




其实SAS 在读取或展示数据时,都要按照一定的FORMATS来进行。只是不过如果是标准的数字型(如不带货币符号,千分位号等)和标准的字符型(如字符中间不嵌空格等),SAS 可以按默认的FORMATS来读取,而不必具体指定。如若不是,则需具体指定。如数据集test2,数字、字符均非“标准”的,故需另外指定读入格式。

  1. data test2;

  2. input pid $ & price dollar9.2;

  3. datalines;

  4. d1 p001 $2,239.5

  5. d1 p002 $456

  6. d1 p003 $231.4567

  7. ;

  8. run;

  9. proc print;

  10. run;
复制代码



2、  SAS FORMATS的分类

SAS FORMATS最常见的有两类:输入格式(informat)和输出格式(format)。顾名思义,输入格式即SAS读入数据的时的规则,输出格式即SAS 输出数据时的规则。

以上面的test2为例,在读入数据集时,由于pid变量中间有空格,所以要加“&”格式修饰符;price有货币符号和千分位符号,所以用dollar格式读入,在读取时以移除他们。不过print 的结果并没有显示货币符号和千分位符号,在explorer窗口打开数据集,也不见货币符号和千分位符号的踪影。怎么回事?如何才能在结果中看到他们?这就需用到输出格式。



  1. data test2;

  2. input pid $ & price dollar9.2;

  3. datalines;

  4. d1 p001 $2,239.5

  5. d1 p002 $456

  6. d1 p003 $231.4567

  7. ;

  8. run;

  9. proc print;

  10. format price dollar9.2;

  11. run;
复制代码


行文至此,我们或许会问?有必要这样折腾吗?读入的时候去掉货币符号和千分位符号,展示的时候又再加上?直接将price变量原样存入不就行了?

硬要说,是可以的,只是要原样存入的话,就只能存入字符型数据,这样做至少有两个缺限:一是数字变成字符型,再进行相关的加减乘除运算和后继统计分析都会很不方便。二是增加了存储数据的空间。


其实,个人理解,简单地说,SAS 输入输出格式的作用有点像“脱外套”和“加外套”的关系。读入数据时存储时,要直击其本质,去掉花哨复杂的“外衣”,剥洋葱似的直取其“精华”部分;展示数据时,就像女孩要出门了,得打扮一番,加些漂亮的装饰,变得“好看”了再展现在世人面前。



当然SAS FORMATS从另一个角度上来说,又分字符型格式和数字型格式,这与SAS 的数据类型相关。一般来说,字符型格式用于字符型数据,数字型格式用于数据型数据,格式和数据类型应该匹配,否则会出错。

此外,SAS FORMATS也可以分为SAS系统自带的格式和用户自定义格式。上面提到和用的都是SAS 系统自带的格式 。而用户自定义的格式是指用户用proc format定义的格式。例:


  1. proc format;

  2. value genderfmt 1='男'

  3. 2='女';

  4. run;


  5. data test3;

  6. input sid $ gender;

  7. datalines;

  8. s001 1

  9. s002 2

  10. s003 1

  11. s004 2

  12. ;

  13. run;

  14. proc print;

  15. format gender genderfmt.;

  16. run;
复制代码


3、  SAS FORMATS的样貌

SAS 输入输出格式,有着统一的样貌。

<$> name <w> . <d>

  简要说明:
$ :字符型格式必需用的前缀
Name:格式的名称,必需符合SAS 命名规则
W :指定读入或输出的宽度,注意,包括小数点,货币符号、千分位号、负号等
. :无论哪种格式都必需的,不能省略,因为靠他区别格式名和变量名
D :小数位数,只用于数字型格式。

4、  SAS FORMAST的使用

总结起来,使用的SAS FORMATS的方法有以下几种:

2        Iput/put 语句

2        Format 语句

2        Atrrib 语句

2        Iput /put 函数

Input语句 用于读入数据时指定输入格式,put语句用于(在LOG里)输出时指定格式;format ,attrib语句可以在DATA步或PROC步中指定格式。不同的是在DATA步中变量和格式是永久关联的,在PROC 步是暂时关联的。当然在PUT语句里也是暂时关联的。


举例说明:

  1. data test4;

  2. input x dollar 6.2 f1 mmddyy7. f2 date7. t1 mmddyy9. t2 date10.;

  3. put x=

  4. /x=dollar8.2

  5. /f1= f2=

  6. /t1= t2=;

  7. format f1 date9.;

  8. attrib f2 format=mmddyy10.;


  9. datalines;

  10. $23.32 110611 06nov11 11/06/11 06nov2011

  11. ;

  12. run;


  13. proc print;

  14. format t1 mmddyy10.;

  15. attrib t2 format=mmddyy10.;

  16. run;
复制代码


   简单解释:x 的dollar格式是暂时关联的,所以在output仍然显示数字格式。

f1,f2 的格式是永久联系的,所以在log和output ,f1都是按date9.格式显示,f2 都是按mmddyy10.格式显示。t1,t2 的格式暂时联系的,所以在LOG里还是显示的数字格式,而非mmddyy10.格式。


Input 和put函数常用于数据类型的转换。如


  1. data test5;

  2.      a=“21121.67”;

  3.     b=21121.67;

  4.     a_n=input(a,dollar9.2);

  5.     b_c=put(a,$8.);

  6. run;
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:formats format FORMA form For character 豆腐块 文章

已有 5 人评分学术水平 热心指数 信用等级 收起 理由
zhou.wen + 1 + 1 + 1 精彩帖子
boe + 1 + 1 + 1 精彩帖子
jingju11 + 3 + 5 + 1 对论坛有贡献
yugao1986 + 1 + 1 + 1 只能加1个
soporaeternus + 5 + 5 + 5 精彩帖子!!

总评分: 学术水平 + 11  热心指数 + 13  信用等级 + 9   查看全部评分

沙发
ryuuzt 发表于 2011-11-17 12:14:32
收藏学习。

藤椅
webgu 发表于 2013-5-17 09:14:38
论坛里贴代码,好容易出错。
SAS资源
1. SAS 微信:StatsThinking
2. SAS QQ群:348941365

板凳
妖帝东皇 发表于 2013-9-30 21:31:32
第一个和第二个代码都有问题~运行得不到期望的结果~
┏━━━━━━━━━━━━━━┓
   ☞❤学而无友必然孤陋寡闻!❤
┗━━━━━━━━━━━━━━┛

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 17:59