楼主: arieljiang
2257 8

缺失数据填充 [推广有奖]

  • 2关注
  • 7粉丝

硕士生

8%

还不是VIP/贵宾

-

威望
0
论坛币
7 个
通用积分
1.4615
学术水平
1 点
热心指数
2 点
信用等级
0 点
经验
6512 点
帖子
69
精华
0
在线时间
162 小时
注册时间
2009-8-26
最后登录
2022-3-23

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据

A 1991 1992  1993  1994 1995 1996  1997  1998 1999 2000
pt1            18                                                  4                       
pt2                        3                                                   

因为数据缺失的比较多,想要填充其他的数据。
我要将表中数据转成:
<5     =1
5~10  =2
11~15   =3
>=16   =4

所以对于patient1猜测应该是第四类定义成4,对于填充只是估摸就好,2千多个数据实在不能手动,大家看看sas怎么处理?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:缺失数据 Patient 数据缺失 怎么处理 Pat

沙发
whiteice 发表于 2012-11-28 20:58:56 |只看作者 |坛友微信交流群
先看看结果需要几,就填补几
或者,在1,2,3,4中随机取
人在尘世间,心在三界外;若无纷繁事,何羡天上仙。

使用道具

藤椅
arieljiang 发表于 2012-11-28 21:03:36 |只看作者 |坛友微信交流群
whiteice 发表于 2012-11-28 20:58
先看看结果需要几,就填补几
或者,在1,2,3,4中随机取
不能随机取,这个数值有具体含义的,而且随着年份增加可能会有趋势

使用道具

板凳
melody507 发表于 2012-11-28 21:39:22 |只看作者 |坛友微信交流群
。cccccghtgh

使用道具

报纸
darkworld 发表于 2012-11-29 15:31:25 |只看作者 |坛友微信交流群
应该要用点随机吧,anyway,你都是在赤果果的造数据呀。。。

使用道具

地板
whiteice 发表于 2012-11-30 20:17:34 |只看作者 |坛友微信交流群
arieljiang 发表于 2012-11-28 21:03
不能随机取,这个数值有具体含义的,而且随着年份增加可能会有趋势
你就还是根据需要造数据吧
人在尘世间,心在三界外;若无纷繁事,何羡天上仙。

使用道具

7
arieljiang 发表于 2012-12-1 10:50:44 |只看作者 |坛友微信交流群
darkworld 发表于 2012-11-29 15:31
应该要用点随机吧,anyway,你都是在赤果果的造数据呀。。。
缺失太多,要补一些数据,但是要合理,不是造假。

使用道具

8
darkworld 发表于 2012-12-5 15:31:50 |只看作者 |坛友微信交流群
arieljiang 发表于 2012-12-1 10:50
缺失太多,要补一些数据,但是要合理,不是造假。
懂了,合理造数据,嘿嘿。

希望你的老板看到的是“合理”而不是“造”这个字。

使用道具

9
arieljiang 发表于 2012-12-6 13:23:37 |只看作者 |坛友微信交流群
darkworld 发表于 2012-12-5 15:31
懂了,合理造数据,嘿嘿。

希望你的老板看到的是“合理”而不是“造”这个字。
今天上了课,缺失数据的处理,是很重要的一块内容。缺失情况分为三种:
完全随机缺失,
随机缺失,
和飞随机缺失。
根据不同的情况选择不同的方法。
我用的是naive的方法,还有很多其他方法,相对准确一些。但对于缺失比较大的时候,填充缺失数据数据的可信度就不高,关于缺失数据达到多少填充不准确也没有定论。对于缺失数据的处理,sas中 proc  ML可以做。
还在研究,相信有更好的填充方法,统计还是十分有用。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 23:35