许多SAS统计过程在建立模型时要求所有模型变量为数字变量。当涉及众多的变量的水平数和交叉项的时候, 分类变量的参数化过程将变得非常繁琐。 在以下我针对在NLMIXED procedure modelling binomial distribution (非线性二项模型)的构建来展示其中的方法和技巧.
值得注意的是程序过程也许不是非常直观. 比如说,四个分类变量分别包含4, 2, 2, 和3个水平。那么所有的变量组合是179个。如果除掉参考水平,剩下47个。在这里运用参考水平方式(reference), 而不是GLM的形式,其原因为nlmixed过程并不像其他过程那样,可以准确地鉴别出那些多余的参考水平值。
我在程序的最后补充给出计算该组合数的程序。整个程序最终将给出这47个变量外加上截距的模型表达式。即为:y=b1*intercept + b2*x1 + ... + b48*x48.
Read sample here
京剧
http://blog.sina.com.cn/s/blog_a3a926360102vcy5.html