按:花一周时间陆陆续续啃完了这本书,因为楼主已考完base和adv, 最近同时也在看SAS的SBA建模与回归相关内容,感觉这本书里有很多东西能够横向联系得上,那么这里顺带写下来一点点心得,算是个读书笔记吧,与大家分享。由于楼主比较懒同时又比较忙(真是奇怪的状态组合),所以也许要分几天完成所有更新。
首先,喝水不忘挖井人。
https://bbs.pinggu.org/forum.php?mod=viewthread&tid=4174542
如果没有这位兄弟的慷慨,我们将被迫花50论坛币高价去买另一个。
其次,不像入门圣经little SAS book那样偏重于教学,这本书比较适用于已经有一定SAS底子的人,比如它不会淳淳善诱不厌其烦地教你怎么去各种花式读数据和列出字符串各种功能介绍,而是从一个个例子入手,所以风格上很偏实际应用。与考base/adv证的教程上浩如烟海的考点相比,这本书真正涉及的知识点也就那么几个,都直接与统计应用挂钩。尽管可能简单粗暴,有的统计背景知识也不讲究说得多透,但感觉拳拳到肉,里面的例子都可以拿来速成应付工作。
所以这是一本偏实战教学的好工具书。毕竟在楼主看来统计应用无非就是两个基本面:
一个是评估已有的结果,进而从一个小样本管中窥豹类推全貌,例如我这个药有没有效果,对哪类对象有效,在一类人群身上的效果与另一类人群的效果相比有没有显著区别,等等。统计上管这类应用叫Descriptive Statistics和Inferential Statistics,像t-test, ANOVA都属于此类;
第二个是根据已有数据预测未来的走向,即Predictive Statistics(在楼主看来,但凡能够预测未来的手段都是牛逼技能),例如已搜集到用户的消费习惯是这样,而这个人的芝麻信用分是这么多,那么根据这些数据,建立一个模型来预测他下个月的消费额度会有多少,假如给这个用户推荐信用卡或某种那个商品,他大概有多大可能会上钩,相应的盈亏业绩怎么估,等等。这本书里涉及的主要手段就是各种线性和逻辑回归。
本书总共分十四章,前头七章基本在讲上头举的第一类统计应用,即描述性与推论统计学范畴。从第八章开始进入第二类预测性统计学,介绍各种回归模型,中间夹杂也讲了离散变量评估,非参数检验以及随机取样。以下楼主就来逐章点评,为了配合本书简单粗暴的风格,尽量简炼划重点,直接引用书上的例子捡有用的讲,能不废话就不废话。
【第一章】
对于有底子的人来说本章可以快进忽略,基本属于热身简介。可以扫一眼快速复习的是举了读数据时最常用的excel的csv格式,记得用infile配合dsd选项来读。
如果是更复杂点的其他格式,比如读Access,SPSS, Stata之类数据格式,也可以用proc import配合相应的DBMS来解决。
【第二章】
第一个登场的是proc means,用来看平均值等各种统计数据。
基本格式就是proc里用class对应分类,var来指明感兴趣的变量对象。
常用的几个配合参数有clm和maxdec,例子如下:
proc means data=example.Blood_Pressure clm stderr maxdec=3;
class Drug;
var SBP DBP;
run;
下一个是proc univariate,不但可以显示各类统计项数字,而且还可以在proc里直接做图,最常用的三类是histogram,probplot和qqplot. 后两者常见于用来判断是否正态分布。
例子如下:
title "Demonstrating PROC UNIVARIATE";
proc univariate data=example.Blood_Pressure;
id Subj;
var SBP DBP;
histogram;
probplot / normal(mu=est sigma=est);
run;
这里有一个不错的点,做直方图时可以配合midpoint参数来自定义分布图横轴的范围,比如:
histogram / midpoints=100 to 170 by 5 normal;
最后一个介绍的是proc sgplot, sgplot有着广泛的做图应用,在本章先提到的是hbox。
有用的两个参数:
1)用datalabel图上直接标记:
proc sgplot data=Blood_Pressure_Out;
hbox SBP / datalabel=Subj;
run;
2)用category来分组,比如按药分类把三组hbox画在一张图上:
title "Box Plots of SBP for Each Value of Drug";
proc sgplot data=example.Blood_Pressure;
hbox SBP / category=Drug;
run;