作者:林淑芬/台湾大学计算机及资讯网路中心教学研究组程式设计师
统计分析方法是研究者或决策者不可或缺的一项工具,SAS不论在学术界或是产业界是常被使用的应用统计软体分析工具之一。 本文将在此说明如何直接从纯文字档及EXCEL快速建立SAS资料档的几个步骤…
统计分析方法是研究者或决策者不可或缺的一项工具,近年来因为电脑系统的蓬勃发展以及统计套装软体的持续开发,不论在学术界或是产业界,应用统计软体来分析数据已成为必然之趋势。 我们都知道SAS是功能非常强大的统计套装软体,可适用在各行各业的统计分析上。 我们也知道建立正确完整的SAS资料档,是日后进行各式各样统计分析成功的第一步。 目前一般都是以纯文字型态的资料来建立SAS资料档,但是我们手边最常也最方便取得与输入的资料格式却是EXCEL档,因此本文将在此说明如何直接从EXCEL快速建立SAS资料档的几个步骤。
一、以纯文字资料建立
以下将举一个实际例子做说明,栏位变项依序是名字、性别、年龄、房号、社经地位、收入,每个变项之间以至少一个空白隔开:

上述的资料先用记事本建好一个名为a.dat的纯文字资料档,以下的程式将根据房间号码找出楼层,并根据实际年龄分组,以便计算各年龄组别及各种社经地位的总收入。
原来的SAS程式撰写如下:


二、以EXCEL2003建立
第二种改进的方法是先以EXCEL建好如下的a.xls。
请注意要用EXCEL 2003版本,目前学校的SAS版本还不能汇入EXCEL 2007,而且因为房间号码要用取子字串函数substr来取出第一码作为楼层,因此必须以'122方式输入,表示为文字型态,不然直接以122方式输入,EXCEL会把它当作数值型态的资料就无法取出第一码作为楼层。 请注意第一列的变项名称须为英文,而且变项名称不能有空白,但人名中间可允许空白,譬如ANDY可以改成ANDY WANG,这是很具弹性的。

接下来我们将从SAS系统直接汇入a.xls档,执行「File」->「Import Data」

选择「EXCEL 97 ,2000 or 2002 Workbook」资料格式:

接着选择活页簿来源:

再选择所要汇入的工作表,并从<Option>检查所输入资料的第一列是变项名称:

选择所要存放的LIBRARY,以及所要建立的SAS资料档名称oldex:

最后按<Finish>即可完成汇入SAS资料档oldex的动作。
接着我们根据刚汇入的原始SAS资料档oldex,再重建一个新的名为ex的SAS资料档,增加楼层和年龄群组的新变项,并且增加LABEL和FORMAT指令。 DATA STEP的程式只需将原本读档的指令INFILE改写成SET oldex,并且去除INPUT指令即可。 也就是复制刚汇入的原始SAS资料档oldex,以此为本再建立增加新变项,或增加LABEL和FORMAT指令产生新的完整SAS资料档。 日后的研究分析就直接使用这个SAS资料档即可。 当然,所有的PROC STEP指令则保持不变。





雷达卡




京公网安备 11010802022788号







