楼主: blliufan
4279 15

[原创博文] 求解答,关于category和dummy [推广有奖]

  • 0关注
  • 0粉丝

硕士生

84%

还不是VIP/贵宾

-

威望
0
论坛币
887 个
通用积分
0.0003
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2530 点
帖子
138
精华
0
在线时间
200 小时
注册时间
2009-9-28
最后登录
2021-10-9

楼主
blliufan 发表于 2012-5-21 13:22:49 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在做回归分析时,关于category variable,是否要转换成dummy variable。
用class和用转换过的dummy variable求出的系数不一样啊。

我该何去何从呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Category Dummy ego CAT ATE category 回归分析

沙发
blliufan 发表于 2012-5-21 13:25:51
比如marriage是category,single,married,divorce。
方法一
proc genmod data=info;
class marriage;
model y=marriage;
run;
方法二
proc genmod data=info;
model y=married single;
run;
这里married和single是转换过的dummy variable。
两者结果明显不一,这是为何
jennings!

藤椅
hcydlee 发表于 2012-5-21 14:18:02
两者的reference group应该是不同的吧, 你手动产生的dummy variables 和系统自动产生的 reference group应该不一样。
80 字节以内
不支持自定义 Discuz! 代码

板凳
blliufan 发表于 2012-5-21 14:34:34
hcydlee 发表于 2012-5-21 14:18
两者的reference group应该是不同的吧, 你手动产生的dummy variables 和系统自动产生的 reference group应 ...
那用哪个好呢?还是说其实没有什么大的差别
jennings!

报纸
hcydlee 发表于 2012-5-21 14:37:11
比较喜欢用手动的,自己设置的,解释起来也轻松。
80 字节以内
不支持自定义 Discuz! 代码

地板
blliufan 发表于 2012-5-21 15:23:33
hcydlee 发表于 2012-5-21 14:37
比较喜欢用手动的,自己设置的,解释起来也轻松。
谢谢啊。还有问题请教啊,我用sample1得到自变量的parameter,然后要预测sample2,这个该怎么做。
jennings!

7
hcydlee 发表于 2012-5-21 16:36:38
blliufan 发表于 2012-5-21 15:23
谢谢啊。还有问题请教啊,我用sample1得到自变量的parameter,然后要预测sample2,这个该怎么做。
http://support.sas.com/kb/33/307.html 这篇文章的Example 1和你的几乎一样。你可以参考一下,基本方法就是用training set 拟合好模型,然后把validation set 的因变量变为missing,和原training set 合并在一起,用合并后的set再拟合一次(validation set的因变量是missing,所以不会用到,模型结果和traning set 的一样),通过设置把来自于validation set的observation做个预测。 具体内容你可以仔细的看下这篇文章。

记得帮我评分哦
80 字节以内
不支持自定义 Discuz! 代码

8
hcydlee 发表于 2012-5-21 17:50:48
hcydlee 发表于 2012-5-21 14:18
两者的reference group应该是不同的吧, 你手动产生的dummy variables 和系统自动产生的 reference group应 ...
看了下user guide.是不一样的。GENMOD, GLMSELECT, LOGISTIC, and PHREG.产生哑变量的方法是由class 的param= option控制的,默认是PARAM=GLM,我们一般手动产生哑变量的方法对应 param=REF.(默认REF=last)
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
blliufan + 1 + 1 + 1 谢谢你啦,貌似只能+1

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

80 字节以内
不支持自定义 Discuz! 代码

9
pl172231 发表于 2012-5-21 19:30:36
hcydlee 发表于 2012-5-21 17:50
看了下user guide.是不一样的。GENMOD, GLMSELECT, LOGISTIC, and PHREG.产生哑变量的方法是由class 的 ...
厉害

10
blliufan 发表于 2012-5-21 19:54:46
hcydlee 发表于 2012-5-21 16:36
http://support.sas.com/kb/33/307.html 这篇文章的Example 1和你的几乎一样。你可以参考一下,基本方法 ...
如果在的话,请教下,做genmod会在result窗口输出结果,但我要做cross validation,不想每一次都要在results窗口处结果,只要能输出data set就行。该怎么办?
jennings!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 10:50