5月份开始,用了24天通过了Base, Advance 和Business Analyst, 终于有几块砖头来敲门了。上来写一篇机经回馈在这里得到的帮助; Bass 和Advance 我相信很多考生都可以顺利, 论坛的资料也非常充足,我就不再详述,我的经验是将Bass 和 Advance 的tutorial 都过一遍再做能找到的机经,不论是理解还是背诵,都能通过。
Business Analyst 因为我分数不高,错的比较多,所以我只写题目,不写我的答案,有些题目记得不详细,只写考点。
以下是其他帖子没有或不完整的机经:
1.拖答案题
左边是选择:
monotonic;
nonmonotonic;
weak;
右边是题目:
spearman Hoeffding
High High 填上面选项
High Low 填上面选项
Low High 填上面选项
Low High 填上面选项
2. 理解ilink的作用 (拼写可能有错,因为在两本教材里查找不到这个词)
3. forward selection 根据什么选择variables (选项里没有P-value 这个选项)
RSQ
R-Square
AIC
MSE
3.如何计算Model SS 和 Sum of square (这里有两题)
4. C statistic 是什么,答案是 area under curve ROC
5. How to calculate C statistic, 公式是percent concordant /(percent concordant + discornant)
6.填空题 : how to adjust sensitivity
P
0 1
0 200 300
A 1 188 312
以上是sample,oversample 了如何调整, event rate of population is 3%, 计算调整后的sensitivity.
(注意:200 和300 是乱写的,总数是500没有错,下一行 188 和312 是题目的数字)
7. 创建两array 第二行表示第一行的missing value,应该用“ ”表示还是用“. "表示
8. 有两个表,上面wrist_size, its chi-square is about 0.029, 下面一个表显示wrist_size M 是significant, wrist_size S 是not significant, 然后选择variabel M 和 S是否significant,wrist_size 是否 significant, M 和 S 之间的interaction 是否 significant
9. median imputation while preparing train data set, what should we do with imputed values to validation data set; 是否应该recalculate using both train data set and validation data set, 或者 apply inputed value directly to validation.
10. what can do with model selection and validation step?
Avoid overfitting;
meet all statistical assumption;
还有其他选项
还有几道题目,想起再补充,在考试期间我大约标记了15题不确定的,我学过Business Intelligence, 有一定的统计基础和SAS使用经验,所以推荐看书。