楼主: melissat
15963 6

[问答] 分类变量的缺失值的填补方法???? [推广有奖]

  • 1关注
  • 0粉丝

硕士生

38%

还不是VIP/贵宾

-

威望
0
论坛币
28 个
通用积分
1.0052
学术水平
2 点
热心指数
2 点
信用等级
2 点
经验
1859 点
帖子
144
精华
0
在线时间
85 小时
注册时间
2007-11-9
最后登录
2022-3-22

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
分类变量的缺失值怎么填补呀?
如果我把有缺失值的变量都去掉,数据就太少了。。但又不知道该如何填补分类变量的缺失值。。

(p.s. 这些数据是打算用来带进一个二分类logistic模型进行预测的。)

请问一下,这种情况该怎么办呀?

先谢谢了!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:分类变量 缺失值 Logistic模型 logistic logisti 模型 如何

熬~~~~
沙发
bbslover 发表于 2016-6-7 01:56:45 |只看作者 |坛友微信交流群
如果你使用R,会有很多missing value inference的方法。

比如:https://cran.r-project.org/web/packages/FastImputation/index.html
https://cran.r-project.org/web/packages/available_packages_by_date.html
https://cran.r-project.org/web/packages/mitools/index.html
https://cran.r-project.org/web/packages/missForest/index.html

使用道具

藤椅
在职认证  发表于 2016-6-7 02:53:08 |只看作者 |坛友微信交流群
首先说说你需要在什么软件里填补缺失值。然后稍微解释一下为什么分类变量会有这么多缺失值呢?你想用这个分类变量做因变量来做logit回归的话填补太多的缺失值是不是有manipulate data的问题啊~ 稍微解释详细一点,大家比较好帮助你~~

使用道具

板凳
melissat 发表于 2016-6-7 11:11:04 |只看作者 |坛友微信交流群
雯 发表于 2016-6-7 02:53
首先说说你需要在什么软件里填补缺失值。然后稍微解释一下为什么分类变量会有这么多缺失值呢?你想用这个分 ...
谢谢你的回答,

我是在spss里填补缺失值,因为数据是问卷调查得到的数据,回答者没有填写的地方,都成了缺失数据。。

我用另外一组数据估计出了一个logi回归模型,然后想把现在这组缺失值很多的数据带进那个已估计出的模型来计算结果//
模型里的变量比较多,将近三分之二的数据都或多或少有空缺的地方。

使用道具

报纸
melissat 发表于 2016-6-7 11:12:33 |只看作者 |坛友微信交流群
bbslover 发表于 2016-6-7 01:56
如果你使用R,会有很多missing value inference的方法。

比如:https://cran.r-project.org/web/package ...
谢谢你,

我用的是spss,,,搞不转R软件的说。。。T T

使用道具

地板
bbslover 发表于 2016-6-7 20:24:09 |只看作者 |坛友微信交流群
如果你会spass,你一定会喜欢R,建议学习一下R

使用道具

7
melissat 发表于 2016-6-7 23:39:12 |只看作者 |坛友微信交流群
bbslover 发表于 2016-6-7 20:24
如果你会spass,你一定会喜欢R,建议学习一下R
谢谢你,
一直以来都听说R的功能很强大,有机会一定好好学习学习。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-2 20:32