关于本站
人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!
获取电子版《CDA一级教材》
完整电子版已上线CDA网校,累计已有10万+在读~ 教材严格按考试大纲编写,适合CDA考生备考,也适合业务及数据分析岗位的从业者提升自我。
TOP热门关键词
1.在读RonCody的Cody'sDataCleaningTechniquesUsingSAS,有蛮多可以学习的地方。做了这么多年的数据管理,对于datacleaning的概念其实没有一个比较明确系统的认识Whatisdatacleaning?Inthisbook,wedefinedatacleanin ...
免费学术公开课,扫码加入![]() |
做了这么多年的数据管理,对于data cleaning的概念其实没有一个比较明确系统的认识
What is data cleaning? In this book, we define data cleaning to include:
• Making sure that the raw data values were accurately entered into a computer readable
file.
• Checking that character variables contain only valid values.
• Checking that numeric values are within predetermined ranges.
• Checking if there are missing values for variables where complete data is necessary.
• Checking for and eliminating duplicate data entries.
• Checking for uniqueness of certain values, such as patient IDs.
• Checking for invalid date values.
• Checking that an ID number is present in each of "n" files.
• Verifying that more complex multi-file rules have been followed.
2. 用PROC FREQ 和_CHARACTER_列出char型变量
- title "Frequency Counts for Selected Character Variables";
- proc freq data=clean.patients(drop=Patno);
- tables _character_ / nocum nopercent;
- run;
- title "Listing of invalid patient numbers and data values";
- data _null_;
- set clean.patients;
- file print; ***send output to the output window;
- ***check Gender;
- if Gender not in ('F' 'M' ' ') then put Patno= Gender=;
- ***check Dx;
- if verify(trim(Dx),'0123456789') and not missing(Dx)
- then put Patno= Dx=;
- /***********************************************
- SAS 9 alternative:
- if notdigit(trim(Dx)) and not missing(Dx)
- then put Patno= Dx=;
- ************************************************/
- ***check AE;
- if AE not in ('0' '1' ' ') then put Patno= AE=;
- run;
3. SAS output显示的问题解决
用的英文版9.2,output显示会出现傻傻傻的乱码字符表格线,更改SASV9.CFG可以解决
找到对应语言版本的cfg文件,记事本类工具打开,修改如下部分,红色用/**/注释起来,蓝色去掉注释
/* This is the OEM character set */
/* -FORMCHAR "衬诼棵糯懒?=|-/\<>*" */
/* This is the ANSI character set (for SAS Monospace font and ANSI Sasfont) */
-FORMCHAR "們剠唶垑妺?=|-/\<>*"
/* This is the ANSI character set */
/* -FORMCHAR "|----|+|---+=|-/\<>*" */
4. 第一次碰到类似下面的error message:
NOTE 49-169: The meaning of an identifier after a quoted string may change in a future SAS
release.Inserting white space between a quoted string and the succeeding
identifier is recommended.
NOTE 49-169: 加引号的字符串后的标识符的含义可能在将来的 SAS 版本中更改。建议在加引号的字符串和标识符之间插入空格。
通过自学检查code解决
「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
您可能感兴趣的文章
人气文章
本文标题:DD's SAS note 04Sep2012
本文链接网址:https://bbs.pinggu.org/jg/ruanjianpeixun_sasruanjianpeixun_1569173_1.html
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。



