楼主: 云堇
2953 2

[问答] 数据挖掘中对age变量是实行log转换还是bucket转换比较合适呢? [推广有奖]

  • 0关注
  • 0粉丝

高中生

32%

还不是VIP/贵宾

-

威望
0
论坛币
2 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
141 点
帖子
14
精华
0
在线时间
23 小时
注册时间
2012-3-6
最后登录
2017-3-6

楼主
云堇 发表于 2012-12-20 23:06:35 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
rt,我的目的是分析收入影响因素,age变量的偏度有些大,我是应该用log使其成正态分布好,还是实行bucket把它分成几组比较好呢?
其实我不太明白两个方法的具体差别啦。。。求解
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:bucket buck 数据挖掘 Age Log 正态分布 影响

沙发
davil2000 发表于 2012-12-21 13:46:12
对数转换能消除一些偏斜、极值的影响。在测量误差较多的情况下,可使用bucket来消除噪音。
已有 2 人评分经验 学术水平 热心指数 信用等级 收起 理由
南海游客 + 1 + 5 + 5 好的意见建议
数据分析师3K + 60 + 1 + 2 + 1 分析的有道理

总评分: 经验 + 60  学术水平 + 2  热心指数 + 7  信用等级 + 6   查看全部评分

R是万能的,SAS是不可战胜的!

藤椅
南海游客 发表于 2012-12-23 16:50:08
davil2000 发表于 2012-12-21 13:46
对数转换能消除一些偏斜、极值的影响。在测量误差较多的情况下,可使用bucket来消除噪音。
好的建议 学习了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 00:45