楼主: tangtt
1176 1

[技术讨论与投票] sas 验证数据集的填缺 [推广有奖]

  • 1关注
  • 0粉丝

硕士生

56%

还不是VIP/贵宾

-

威望
0
论坛币
1354 个
通用积分
2.8500
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
834 点
帖子
29
精华
0
在线时间
294 小时
注册时间
2009-7-25
最后登录
2023-9-25

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在sas建模过程中
验证数据集中的连续属性 缺失的话 我可以按照训练数据集中的中位数(如果训练数据集中是用中位数填缺的话)去填缺
那么验证数据集中的水平属性 缺失的话 我应该怎么填缺呢?

我在训练数据集中 考虑按照各个水平的分布情况 对缺失的水平属性进行填缺
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 训练数据集 训练数据 中位数 中位数

生于理想 死于现实 但 心中恒有天堂
沙发
zxn2011 发表于 2015-3-29 15:54:36 |只看作者 |坛友微信交流群
sas 有三种imputation的方法:regression,mcmc和propensity score
推荐用mcmc,我跟我的导师聊imputation的问题时候,他跟我说过这么几句话:用平均值中位数去填充的做法一定要避免因为这普遍被认为是编造数据,Monte Carlo是比较推荐的方法,因为它毕竟保持了数据原有的distribution

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-23 19:28