楼主: jeffkykong
1483 4

[学习分享] 刚考完A00-225 SAS Advanced Predictive Modelling Exam 经验分享 [推广有奖]

  • 0关注
  • 7粉丝

本科生

89%

还不是VIP/贵宾

-

威望
0
论坛币
295 个
通用积分
1.0000
学术水平
0 点
热心指数
2 点
信用等级
1 点
经验
2362 点
帖子
106
精华
0
在线时间
46 小时
注册时间
2017-4-19
最后登录
2019-1-18

jeffkykong 发表于 2018-10-19 12:04:25 |显示全部楼层
本帖最后由 jeffkykong 于 2018-10-19 12:20 编辑

今年6月考完CFA Level-II后,花了近3-4个月才敢考A00-225,88%通过,是我考过SAS 专业试当中考核范围最广,时间花最多的一个试。
110分钟,52MC,共有4个topics
1) Regression
2) Open Source Model
3)Big Data (SAS Visual Statistic, PROC IMSTAT, Enterprise Miner)
4) Neural Network

[1. Regression]
个人认为问得颇深入,虽然跟之前考过的“A00-240 SAS Statistical Business Analysis”syllabus重复但就很重concepts.有3-4条针对oversampling adjustment, 比如confusionmatrix, lift chart, gain chart, roc chart 如何因应prior probability而修改(问了1题prioradjusted TN, FN, FP, TP 的equations 配对, 1题sensitivity,specificity 不受prior prob. 影响).如何选择decision cutoff, 对rocchart, depth ,misclassification rate的关系(1题问了gainchart 中reference line 是什么来). oddsratio 问得很深入, generalized linearregression 中的link function 是什么distribution是什么(记得有1题给了estimates table, 给了个linkfunction, 及distribution function, 问response是什么数值) .   

[2. Open Source Model]
才6题, 相对简单做过mock 卷的没大问题, 问proc options option=rlang. 问supervised model pmml model. 问merge mode 中function predict 的program line (&EMR_EXPORT_TRAIN <- predict(&EMR_MODEL, &EMR_IMPORT_DATA, type ="prob")). 问使用python 之前要先导出delimitedfile (csv), SAS code node等.

[3. Big Data, SASVisual Statistic]
Decision tree 特性优缺, influence plot 的理解,parameter estimates 中degree of freedom 是什么来(记得有1题给了个tree-map问其中一个leaf node 的内容, 是否terminal nodes). Type I, Type II errors同decision cutoff 的关系.Clustering 也问了约4题,其中一题给客户需求, 然后问应该如何设置Clustering setting去做model, 如number of cluster. 从parallel coordinates 解释各个clusters的特性.各个models 如何才可以互相比较(条件),选出campion models.

[3. Big Data, SAS PROC IMSTAT, HP Enterprise Miner]
主要问program syntax (人肉complier). randomwoods 每个tree是如何构成, 如由多少个variables 及observations.genmodel 跟glm statements 的用法以及分别.score statement 跟access statement 的用法以及分别.HPEM 一题问principal component同一般inputs的分别. 一题问如何决定取多少个PCs(scree plot, eigenvalue-greater-than-one, cumulative variation explanation). 一题给了个zero inflated model 的zi parameter table, 问里面effectestimates的_miss是什么来为何有些为0.

[4. Neural Network]
问了Rosenblatt's perception 的应用例子, 要我找出那个case不能用,那个case能用. 一题问equalslope combination function 中SAS 的操作流程.一题问activation function如何选用.一题问什么是direct connection ( skiplayer), 一题问multilayer perception 中计算出parameters的数目.什么时候用softmax, 为什么用preliminary training, 为什么用weight decay 及early stopping. 当然, PROC NEURAL 的program syntax 也有3题, 其中一条问connect in out有什么问题(没有用hidden layer). 给了个HP Neural Node 的setting, 问以下那个为true。



stata SPSS
zhangvin 发表于 2018-10-19 22:53:10 |显示全部楼层
谢谢大神分享!非常感谢
回复

使用道具 举报

simple18 发表于 2018-10-29 22:07:33 |显示全部楼层
谢谢楼主分享!
回复

使用道具 举报

alexfang2017 发表于 2019-1-6 23:48:09 |显示全部楼层
谢谢楼主分享!

也想考A00-225,跪求分享备考的course notes。

需要course notes for

2) Open Source Model
3)Big Data (SAS Visual Statistic, PROC IMSTAT, Enterprise Miner)
4) Neural Network




回复

使用道具 举报

hsubin 在职认证  发表于 2019-1-7 08:05:48 |显示全部楼层
谢谢楼主分享很棒的经验!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-6-19 23:46