该书的特点:
与国内仅有的几本SAS基础书相比,最大的不同在于,不是以软件为导向来逐一介绍各种命令语法,而是以解决实际问题为导向,介绍如何用SAS来协助实际工作。比如,你可以从以往书中学到count函数的用法,但却不知道原来用count函数还可以分析淘宝商品的评价;你可以从以往的书中学到数组,但却不知道原来结合数组可以写出一个查找缺失值的万能程序;你可以从以往书中学到proc sgplot绘图命令,但却学不到如何利用它来综合绘制任意想要的图形;等等。
本书另外一大特色是,是以对话形式引导读者去思考和学习。书中不少对话其实都是来源于现实中研究生和我的对话,他们也是从零开始学SAS,正如本书的主人公小白一样,都是对SAS一无所知。所以本书中小白的很多问题,相信也是现实中很多SAS小白想问的问题。只有走过的人才会明白,从零开始学习一门软件语言是多么地痛苦和无助,如果再没有一本能让你看得下去的辅导书,那更的是一种折磨。所以本书采用对话形式,很大程度上是想拉进与读者的距离,让读者消除初学SAS的紧张和枯燥。
该书的目的:
本书不在于教你了解这些SAS命令或函数的基本用法,这些很简单,你只要看SAS help,比什么教程写的都详细。本书的目的在于通过介绍这些命令和函数,让你了解隐藏在它们背后的实际用途。比如看到round函数,如果你只知道它可以用来对数值四舍五入,这是最基础的,不值一提。但你如果还能利用这种四舍五入的功能对变量进行自动分组,那才是思路的开阔。
该书的内容:
本书内容并非包罗万象,恰恰相反,内容很少,主要涉及三大部分:数据整理、作图和制表。对于SAS软件而言,任何一本书都不可能包括所有内容。越是包罗万象的书,有时反而越不实用,因为它们内容太多,每部分的内容都只能是蜻蜓点水。对于这种书,我只能说,你为什么不直接去看SAS help呢?如果仔细阅读国外优秀的SAS基础书,不难发现一个特点:绝不贪多,要么不介绍,介绍的话就会很深入,一定要让你明白为止,哪怕翻来覆去地说。这看起来似乎有点傻,但却不得不令人感慨:看非母语的英文书反而比看中文书更加清晰。所以本书也是基于这一思想,凡是提到的内容,尽量用白话讲的透彻,争取将读者引领进SAS的大门,至于能不能登堂入室,还得看你自己的努力程度。
该书的具体内容:
(1)建立数据集的基础和高级议题。从最简单的建立SAS数据集开始,逐步深入,介绍如何产生新变量、如何对数据集中的变量进行修饰、如何合理地运用输入和输出格式来完成一些实际工作,等等。
(2)介绍了比较实用的几个函数。不仅是介绍函数本身,更重要的是介绍函数的使用思路,介绍如何应用函数来处理实际问题,而这正是目前国内大部分书中所缺乏的。
(3)介绍了数据清洗过程。如何查找重复值、异常值、缺失值等,这是所有数据的必须过程。本书不仅提供了这些处理过程的思路和命令,更是直接给出了一些现成的打包程序,你可以直接拿来主义,用它们来执行数据清洗。
(4)SAS做图。这是本书的一大特色。目前国内尚无如此详细介绍SAS绘图的书籍,本书花了大量篇幅介绍如何利用SAS的菜单和命令绘制各种常规和非常规的图形,相信看了本书的介绍以后,你再也不用为绘图而犯愁了。
(5)SAS制表。不仅介绍了常规的制表程序,而且介绍了很多高级的深入用法,如对表格的详细修饰、将表格直接输出为标准的三线表等。这些都是实际中非常实用的例子,不管你是在公司还是事业单位,相信都会用到上这种实用的报表。
(6)附录。限于篇幅,本书有的内容没有在书中体现,但以电子版的形式作为附录放在光盘中。附录主要包括两部分:一是给SAS新手看的,如常见的SAS错误提示、SAS一些高效和低效写法的比较等。二是写给SAS高手看的,相信不少SAS高手也都用过R软件,本书介绍了如何在SAS中调用R,将二者功能结合起来,更能体现出SAS的优势。
什么样的人会对该书感兴趣:
如果你跟本书的主人公一样,是一个零基础的SAS小白;如果你曾经对SAS望而却步,但却又始终抱着一个学习SAS的梦想;如果你曾经学过SAS,但始终感觉仍在门口徘徊,无法登堂入室;如果你的工作需要处理一大堆的数据,正在发愁如何提高数据管理的效率;如果你还在抱怨SAS做不出精美的图形;如果你觉得SAS help太吃力,想看一本解释的更加通俗的SAS基础参考书;……。所有的这些,你都可以拿起本书,相信本书可以解决你的这些问题。