完全原题;3、5、6、8、20、21(改成填空)、24、29、30、32、34、36、38、41(改成填空)、44、45、48、49、51、52、53、55、56、58、60、62、65
变型题:
9、model A比较好
15、改成了10% events 90% non events,19 times higher
16、换了选项的说法
17、数字一样,换成了算accuracy和error rate
22、only换了一下地方,但其实很好区分。另一个干扰项是different from all other,好像是这样
23、换了数字,还是求r sq
25、变型,和之前jj提到的一样
28、改成redundant
33、including改成remove
35、图是一样的,问怎么remedy,选项有class X,log transform,add quadratic part,还一个是啥忘了。我不确定答案,之前有人jj写的是选log transform,但我总感觉不对。也有人说选add quadratic part这个。我是觉得图已经是二次函数的图了,不明白为啥还要加一个quadratic part。
我好像选的class x。因为书里有句话是:adding a polunomial term or binning the predictor variable into 3 groups and treating it as a classification variable can improve the model fit.
39、改成remove
43、改成了填空,有多少个obs
47、改成了看sbc
50、改成选influence的:cooks d
57、改成disordant
其它新题或者变型题:
samplesize=800 outall
hieracrchy single这个:和以前jj提到的不同,不是xy,是具体的比如gender之类的变量名字
anova:at least 2 means are different
improper use of proc logistic那题
peasron的用处:linear & monotonic
how to generate roc curve: proc logistic
gains chart baseline
logistic with male/female, high/low:param=, ref=
给一个表,看有没有collinear:vif都小于10
overfit:large different between training&test data
还一个是给两个表,其中一个变量有3个level(s,m,l),上边的表p chi sq是significant的,下边是regression的表,两个level不是significant,问这个3个level的变量到底是不是significant
好像还有其它的,但实在记不清了