SAS Statistical Business Analysis(SBA) 机经里的一道题目 有疑问
给一个model,关于education的categorical variable有两种方式引进: 8 level v.s. 4 level,
问为什么用4 level而不是8 level (4选2)
选项:
A.4 level model reduce the chance of overfitting
B.4 level model reduce the dimension of input space
C.4 level model reduce the probability of bias estimate of parameter
D.8 level model is more likely to cause collinearity
我 主要在 A和D 还是 B和D 之间犹豫。
请各位 统计达人,SAS达人 给予指教,多谢多谢!