|
实话实说,有过SAS使用经验的用户应该都会有这么一种感觉,对比Rstudio的精致炫目,Stata的灵动小巧,每次打开SAS都觉得二十一世纪都过了快五分之一了,windows从7跳到10了,怎么还会有这么老土界面的软件,完全配不上“数据分析”这么高大上的工作性质。再回忆起安装SAS时,十几二十Gigabyte的安装(成功与否全凭运气的)文件,对SAS的印象就是一个词,老气横秋。SAS从9.1到9.4,除了应用图标换了一下,界面设计仍旧我行我素地保持着,资格老就是这么霸道。
然而,多了解以后才渐渐感觉到SAS的哲学更可能是:大音希声,大象无形,重剑无锋。例如说,在我的工作中经常会用到一些微观计量经济的技术,Stata和R都有由用户贡献的现成命令或package,而且强大灵活,但是SAS由于不是开源,官方也没有对应的proc,以致不少人认为SAS落后。其实不然,后来我才发现,SAS并不是给某一类人或某一学科专门使用的软件(例如EViews或Gauss),她是站在更高的层次,为所有可能使用基于统计学方法的数据分析用户提供一般化的工具,只要有模型,她就编得出来。
我想任何统计或计量经济软件的初学者都会面临一个同样的困境,我看了这么多遍书,命令代码都记得滚瓜烂熟了,怎么真一到用,各种提示错误呢?然后心中一万头神兽奔腾而过。这其实是因为市面上的各种“统计分析教程”的例子都是基于“干净”的数据,也就是已经将数据整理到已经达到进行分析所需的地步,然而如何整理到这一步它们是不讲的,也没法讲(也不排除那些作者也讲不出),更不用说分析后的结果呈现了。有数据分析经验的童鞋们都知道,数据分析中几乎90%甚至更多的时间用在了清理数据和后续的结果报表整理上,而现实中的数据千奇百怪,五花八门,遇到的问题不一而足,这也就是为什么没有专门讲如何整理数据的宝典:数据整理的问题完全是根据需求来的,用户想分析的标的不一样,即使是同一份原始数据,处理的方法也可能大相径庭。所以,在数据处理上,老鸟给菜鸟的建议可以归纳为先知道软件能干什么,再多加练习。真正的数据处理工作是一套组合拳,是由一个个分解动作和用户解决问题的逻辑共同组成的。解决问题的逻辑更大程度上取决于用户的经验和悟性,教材课本能提供的信息主要还是分解动作,如果还能引领初学者提升解决问题的逻辑和思考问题的方式,那真是善莫大焉。
SAS本来是一个帮助人类工作提升效率的工具,然而现在随着软件和统计技术的发展,对于初学者来说她反倒成为了不少人的阻碍,尤其是在数据处理上,而且不能忽视的是大多数用户在基本计算机科学知识上的无知或知之甚少(比如,据我的观察,分不清内存和硬盘的人绝不是少数)。这时就需要有一本教材能放下“教书育人”的架子,像个老司机,哦不,老师傅,用浅显的语言来讲述。我想,这可能会是这本书最具价值的地方。另外,这本书还改进了SAS做图,用SAS做出了R作图的既视感,这叼炸天的技能也是没谁了,作者证明了SAS老虽老,但也能够很炫酷。虽然我也不是SAS的资深用户,但还是非常想拥有这么一本SAS教材的,即使没有运气抽到奖,我也会买一本来看看的。
|