楼主: guangqing
1905 2

求助 关于哑变量设计的标准 [推广有奖]

  • 0关注
  • 0粉丝

高中生

60%

还不是VIP/贵宾

-

威望
0
论坛币
54 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
259 点
帖子
20
精华
0
在线时间
28 小时
注册时间
2009-6-25
最后登录
2012-9-7

楼主
guangqing 发表于 2009-7-22 04:41:20 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
sas菜鸟请教 高手  问题如下:
数据库很大 40万 左右  打算用logistic回归  dependent 变量 以设好 (0 1) 20多个independent变量
什么形式的都有 有连续型的 有categorical 型的(但是取值都在6个以上) 所以需要设计哑变量  请教各位哑变量设计的标准是什么?
举个例子  categorical 型变量 6个取值 a b c d e f ,先用频率统计 得到
  0 1
a 10 15
b 6 4
c 5 5
d 20 30
e 8 9
f 1 2
问题是 怎样设计这个变量的哑变量  设计6个? 还是看他们的比值 比如a 和d ,b和c就可以放在一起设计?
连续型的变量怎样分类? 谢谢  不知道说明白了没有。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:哑变量 Categorical Independent logistic回归 Dependent 求助 变量 设计

沙发
daliang1010 发表于 2009-7-22 15:19:58
楼主可以只考虑之比较感兴趣某几个分类,不用全部使用吧
好好学习,天天向上!

藤椅
guangqing 发表于 2009-7-23 02:13:17
我也不知道选哪几个 可以 呵呵 看来没人能帮上我了
我在去找找书吧 谢谢楼上的了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-20 19:44