楼主: arieljiang
2493 8

缺失数据填充 [推广有奖]

  • 2关注
  • 7粉丝

已卖:14份资源

硕士生

8%

还不是VIP/贵宾

-

威望
0
论坛币
7 个
通用积分
1.4615
学术水平
1 点
热心指数
2 点
信用等级
0 点
经验
6512 点
帖子
69
精华
0
在线时间
162 小时
注册时间
2009-8-26
最后登录
2022-3-23

楼主
arieljiang 发表于 2012-11-28 20:33:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据

A 1991 1992  1993  1994 1995 1996  1997  1998 1999 2000
pt1            18                                                  4                       
pt2                        3                                                   

因为数据缺失的比较多,想要填充其他的数据。
我要将表中数据转成:
<5     =1
5~10  =2
11~15   =3
>=16   =4

所以对于patient1猜测应该是第四类定义成4,对于填充只是估摸就好,2千多个数据实在不能手动,大家看看sas怎么处理?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:缺失数据 Patient 数据缺失 怎么处理 Pat

沙发
whiteice 发表于 2012-11-28 20:58:56
先看看结果需要几,就填补几
或者,在1,2,3,4中随机取
人在尘世间,心在三界外;若无纷繁事,何羡天上仙。

藤椅
arieljiang 发表于 2012-11-28 21:03:36
whiteice 发表于 2012-11-28 20:58
先看看结果需要几,就填补几
或者,在1,2,3,4中随机取
不能随机取,这个数值有具体含义的,而且随着年份增加可能会有趋势

板凳
melody507 发表于 2012-11-28 21:39:22
。cccccghtgh

报纸
darkworld 发表于 2012-11-29 15:31:25
应该要用点随机吧,anyway,你都是在赤果果的造数据呀。。。

地板
whiteice 发表于 2012-11-30 20:17:34
arieljiang 发表于 2012-11-28 21:03
不能随机取,这个数值有具体含义的,而且随着年份增加可能会有趋势
你就还是根据需要造数据吧
人在尘世间,心在三界外;若无纷繁事,何羡天上仙。

7
arieljiang 发表于 2012-12-1 10:50:44
darkworld 发表于 2012-11-29 15:31
应该要用点随机吧,anyway,你都是在赤果果的造数据呀。。。
缺失太多,要补一些数据,但是要合理,不是造假。

8
darkworld 发表于 2012-12-5 15:31:50
arieljiang 发表于 2012-12-1 10:50
缺失太多,要补一些数据,但是要合理,不是造假。
懂了,合理造数据,嘿嘿。

希望你的老板看到的是“合理”而不是“造”这个字。

9
arieljiang 发表于 2012-12-6 13:23:37
darkworld 发表于 2012-12-5 15:31
懂了,合理造数据,嘿嘿。

希望你的老板看到的是“合理”而不是“造”这个字。
今天上了课,缺失数据的处理,是很重要的一块内容。缺失情况分为三种:
完全随机缺失,
随机缺失,
和飞随机缺失。
根据不同的情况选择不同的方法。
我用的是naive的方法,还有很多其他方法,相对准确一些。但对于缺失比较大的时候,填充缺失数据数据的可信度就不高,关于缺失数据达到多少填充不准确也没有定论。对于缺失数据的处理,sas中 proc  ML可以做。
还在研究,相信有更好的填充方法,统计还是十分有用。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 03:22