楼主: 看看2
3447 3

[其他] 关于分类变量数字化问题请教(100论坛币..) [推广有奖]

  • 0关注
  • 0粉丝

大专生

53%

还不是VIP/贵宾

-

威望
0
论坛币
2272 个
通用积分
0
学术水平
1 点
热心指数
12 点
信用等级
0 点
经验
154 点
帖子
24
精华
0
在线时间
87 小时
注册时间
2007-7-12
最后登录
2018-3-25

楼主
看看2 发表于 2007-8-9 16:07:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
<P>做逻辑回归时,对于分类变量数字化问题:</P>
<P>    一种解决方是用0,1编码。若分类变量有n个值,则0,1串长度为n-1。<BR>    例如,某产品有3种颜色:黑、白、绿。若黑为(0,1),白为(1,0),则绿是</P>
<P>(1,1),还是(0,0)?</P>
<P>     还有一种办法是求分类变量WOE值。<BR>     请问WOE值如何求才合理呢?<BR>     仍以某产品有3种颜色为例。假如要用逻辑回归,判断客户对产品的满意度。而颜</P>
<P>色是产品的特性之一。则三种颜色的WOE值该如何求。</P>
<P>     对于神经网络模型而言,也需把分类变量数字化。</P>
<P>     请问数字化方法是与照逻辑回归相同,还是有其它注意事项?</P>
<P>     最后,请大家注意,管理员答应回答一个问题,奖100论坛币....</P>
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:100论坛币 分类变量 0论坛币 论坛币 数字化 论坛 请教 变量 分类 数字化

回帖推荐

tianhuo2 发表于2楼  查看完整内容

该产品颜色是个三分类变量,那么只要引入两个变量color1和color2,其中color1取0或1,分别代表不是黑色和是黑色;同样color2也取0或1,分别代表不是白色和是白色。只需要引入两个变量color1或color2就可以,不必对绿色再引入color3这个变量.因为如果color1=0且color2=0,代表既不是黑也不是白,那么就是绿了. 从理论上说,对一个n分类变量就只要引入n-1个(0,1)取值的逻辑变量就可以.如果引入n个逻辑变量是错误的,因为这 ...

本帖被以下文库推荐

沙发
tianhuo2 发表于 2007-8-14 13:39:00
<P>该产品颜色是个三分类变量,那么只要引入两个变量color1和color2,其中color1取0或1,分别代表不是黑色和是黑色;同样color2也取0或1,分别代表不是白色和是白色。只需要引入两个变量color1或color2就可以,不必对绿色再引入color3这个变量.因为如果color1=0且color2=0,代表既不是黑也不是白,那么就是绿了.</P>
<P>从理论上说,对一个n分类变量就只要引入n-1个(0,1)取值的逻辑变量就可以.如果引入n个逻辑变量是错误的,因为这会引起一个叫"多重共线性"的问题,也就是说存在color1\color2\color3取值向量的一个线性组合其值等于0,这将使得回归系数的方差变动很大,这样得出的回归系数就不可靠了.</P>
<P>反正回归当中这个问题是这样处理的.神经网络模型我只会瞎用用,理论上还搞不懂.提出来,希望对您有所帮助.</P>
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 10 精彩帖子

总评分: 经验 + 3  论坛币 + 10   查看全部评分

藤椅
ereree 发表于 2007-8-14 14:27:00
虚拟变量的设置在郭志刚那本spss的书有详细讲的。
给中文世界的优质语料添砖添瓦

板凳
gaotao0727 发表于 2012-11-7 10:28:46
学习了~~
衣带渐宽终不悔,为伊消得人憔悴~~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-26 20:26