楼主: 饺子大神
8304 9

[数据管理求助] Missing值的处理 [推广有奖]

  • 0关注
  • 2粉丝

博士生

52%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
53.2826
学术水平
4 点
热心指数
5 点
信用等级
4 点
经验
2499 点
帖子
254
精华
0
在线时间
153 小时
注册时间
2011-11-28
最后登录
2022-8-17

楼主
饺子大神 发表于 2016-8-3 10:33:19 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如下图:我最后要使用的变量是Total,Total=Score1+Score2+Score3+Score4
问题是:每个Score里面很容易就出现缺失值,导致也成为Total缺失值,这种情况应该怎么处理?
Total是研究的因变量。如果不做出任何处理,导致模型最后的有效数量只有200多observation。但是如果做出处理,比如用0替代“.”,那么是不是篡改了数据本身的值?
感觉很困惑,请教论坛里的大神们~~~~~ QQ图片20160803170407.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:missing SSIN Miss ING Iss 因变量 模型

QQ图片20160803102722.png (15.61 KB)

QQ图片20160803102722.png

沙发
饺子大神 发表于 2016-8-3 10:40:34
PS:0在这个研究背景中是有意义的,表示这个人完全没有健康问题。

藤椅
lorson 在职认证  发表于 2016-8-3 15:41:11
如果score1\2\3\4..表示是不同期的可加数值的话,应该可以做有效样本的均值,来替代total所要达到的意义。
已有 1 人评分热心指数 收起 理由
饺子大神 + 1 精彩帖子

总评分: 热心指数 + 1   查看全部评分

板凳
Howard7738 发表于 2016-8-3 16:14:02
egen mean_egen = rmean(score1-score5)
list
已有 1 人评分热心指数 收起 理由
饺子大神 + 1 精彩帖子

总评分: 热心指数 + 1   查看全部评分

报纸
饺子大神 发表于 2016-8-3 16:52:44
lorson 发表于 2016-8-3 15:41
如果score1\2\3\4..表示是不同期的可加数值的话,应该可以做有效样本的均值,来替代total所要达到的意义。
我在想,用均值法更好,还是我用最近某年的值去替代?

地板
饺子大神 发表于 2016-8-3 16:53:09
Howard7738 发表于 2016-8-3 16:14
egen mean_egen = rmean(score1-score5)
list
我换了一下数据的排列形式,请再帮忙看看~

7
饺子大神 发表于 2016-8-3 17:07:31
请看贴子中的那张图哈~~~~~~~

8
饺子大神 发表于 2016-8-3 18:08:03
要算这个人的这个变量的均值命令是要怎么写。。。。

9
饺子大神 发表于 2016-8-3 18:18:44
bysort id:egen ave=mean(Score1)

10
饺子大神 发表于 2016-8-3 18:38:33
然后再把missing值replace成ave的值就好啦

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 00:38