苹果/安卓/wp
本科生
0%
还不是VIP/贵宾
该用户从未签到
应届毕业生专属福利!
送您一个全额奖学金名额~ !
经管之家送您两个论坛币!
[此贴子已经被作者于2005-9-29 11:02:38编辑过]
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
kevino 发表于8楼 查看完整内容
蓝色 发表于6楼 查看完整内容
使用道具 举报
副教授
怎么年龄也做二分类处理啊,年收入也做二分类?文化程度?spss对自变量的数量有要求吗?而且我看年收入和文化程度应该相关性比较高的,肯定有自变量的共线性问题。
年龄:45以下,>=45,收入:>=5000元,5000元以下,文化:初中以下,初中以上。
spss对自变量的数量没有要求。
因为有高人指点说自变量不易太多,所以我不知道根据什么来取舍自变量。
谢谢你能回答我的问题!
从理论上来说能够把影响因素尽量多地考虑进去应该是好事吧。但是可能一些自变量之间存在着比较强的相关关系,spss中不是有自变量的进入的方法的吗?如果自变量之间没有相关性,并且14个变量同时进入时拟合效果比较好就可以的啊。
当然,logistic模型对样本的数量要求比较严格,而有人提出了一些最低要求,而自变量少一点,对样本数量的要求就会高一点,但是你有10000个样本,有什么好怕的。
真希望有高手来指教!!!
我想知道"自变量之间的相关性"是用什么办法来确定的,这样我就知道了自变量取舍了。
我看到资料上有用100个自变量。
“拟合效果比较好”怎么确定
我用这14个自变量做了一下,OR值大于2的有5个因素,当我删掉自变量A时,OR值会增加,删掉自变量B时,OR值会减少,删掉自变量C时OR值没有变化。那是不是说对OR值没有变化的那个自变量可以不选?而对OR值有变化的自变量不管OR值增加还是减少都不能舍去?
[此贴子已经被作者于2005-9-29 14:03:24编辑过]
贵宾
总评分: 经验 + 2 论坛币 + 10 查看全部评分
兄弟,这个论坛上的几个spss教程中都有关于logit模型的介绍,另外,自变量之间的多重公线性问题在一般的计量经济学书上都有,故咱拉的的书上也有,你先看看,然后看看spss 上是怎么操作的,资料这里都有的
硕士生
长期投资者
我认为不能直接输入,因为年龄、婚姻、收入、教育等变量明显存在共线性,这四个变量的相互作用将影响你模型的预测能力。比较好的做法是,再加上这几个变量的联合变量,然后分组。每个样本中联合变量为1时,则分变量不再为1。比如,年龄大于65且未婚的变量,其联合变量为1,但年龄大于65已经变为0,未婚变量为0。
我认为你仅作二分是不太能说明问题的,一些变量还是多分几层比较好。
古扎拉蒂的《计量经济学基础》第四版中文中,第二册的第553页,其例子与你的问题非常相似,你可以重点参考。
附:我觉得计量经济学是初级还是高级并不重要,高级的无非多会几个估计和检验的方法,无非会推导一些定理。计量最为重要的是,你知道面对一大堆数据时,知道需要用什么方法来解决它,而且知道为什么用这些方法。
我是第一次帮人做Logistic,请教了不少人,可能是因为我理解问题,一直没有弄明白,我会找到《计量经济学基础》这本书好好学学。这个论坛我知道的很早可来的少,以后我要常来请教,会在这里找一下有关资料学学,我的水平不客气的说比初级还初级,所以各位朋友有兴趣回答我的问题时,尽管指教就是。这里表示感谢了!
[此贴子已经被作者于2005-9-30 9:40:19编辑过]
发表回复 回帖后跳转到最后一页
初级热心勋章
初级信用勋章
初级学术勋章
中级学术勋章
中级热心勋章
中级信用勋章
高级热心勋章
高级信用勋章
京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明 免责及隐私声明