为便于表达,将复杂的经济问题抽象成简单例子,数据如下(为Excel表格):
其中no为学号,可区分每一个学生;y为0代表该生是普通班,y为1代表该生是实验班;变量f1-6代表各个学生6个方面的素质,以得分表示;总共200个学生,实验班50个,普通班150个,1个实验班学生配对3个普通班学生,仅列出前5个,后面数据省略
no y f1 f2 f3 f4 f5 f6
003 1 43.5 56.6 83.2 64.7 76.4 87.2
010 0 47.3 39.8 66.4 58.7 67.5 86.7
012 0 38.6 33.6 54.9 40.8 56.4 68.3
015 0 35.6 43.6 68.5 60.6 67.3 57.2
005 1 52.1 46.5 89.2 70.2 69.7 90.5
… … … … … … … …
目的:用f1-f6这6个变量来区分实验班和普通班的学生,以6个变量为自变量,欲通过调用SAS MDC过程分别建立multinomial logit model和mixed logit model。在mixed logit model中,假设某些(个)自变量的系数服从正态分布,反复测试,最后选择使各系数估计值显著,模型拟合效果较好的那个模型,与multinomial logit model的结果进行比较。
问题:1、如何对数据进行重新排列,或者设置变量,以满足MDC过程的要求
2、对帮助中给出的如下语句中的变量和参数,用于我的例子时该如何改写
proc mdc data=one type=mixedlogit;
model decision = ttime / nchoice=3
mixed=(normalparm=ttime);
id pid;
run;
急!!!恳请高人不吝赐教,感激不尽!!!除论坛外,也可邮件:autumnzjj@163.com、QQ:56733890联系。
[此贴子已经被作者于2008-6-13 15:48:46编辑过]