楼主: pvli
7345 12

[原创博文] 数据缺失的填补方法 [推广有奖]

11
tj0412ymy 发表于 2012-1-5 18:14:59
可以尝试采用聚类的方法去填补缺失值。最基本的想法是这样的:先考察性别和年龄对患病是不是有显著差异的,若有显著差异,则利用非缺失的变量去做向量聚类(分2类)。比如,某一观测的性别缺失,看这条观测被分到的组里面的性别比例,若男性多于女性,则缺失的性别值为1,否则为2;若相等的话,1或2均可(不过这种情况应该很少见)。同理,针对年龄的缺失,也可如此处理。仅供参考!
对SAS和统计方面感兴趣的朋友,请加SAS学习和认证讨论群:169157207。欢迎在群上讨论!

12
jackchan2012 发表于 2012-2-8 02:49:45
pvli 发表于 2012-1-5 14:49
STD  =标准差??
不是,是proc STDIZE

13
jingju11 发表于 2012-2-8 03:02:23
SAS 提供LOGISTICREG RESSION的方法填补class变量 in proc MI。另外比较关键的是,应该处理有关随机填补所导致的随机性。不考虑这一点的方法有错误的。京剧

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-26 08:53