楼主: keepvigil
43462 24

[一般统计问题] 回归分析的时候需要让所有变量都不存在缺失值吗? [推广有奖]

11
tony2040044 发表于 2015-3-7 14:39:25 |只看作者 |坛友微信交流群
这个问题,最好的办法就是不要删,而是把无效的replace成.

这样处理起来灵活,免了很多重复的工作

使用道具

12
007kimmy 发表于 2016-6-13 17:35:57 |只看作者 |坛友微信交流群
学习了,思考思考~

使用道具

13
007kimmy 发表于 2016-6-14 09:27:18 |只看作者 |坛友微信交流群
tony2040044 发表于 2015-3-7 14:39
这个问题,最好的办法就是不要删,而是把无效的replace成.

这样处理起来灵活,免了很多重复的工作
没看明白:
缺失值本来就是 . 啊,把无效的替换成 . 还是缺失值啊,回归的时候那一行观测是不纳入分析的。是这个意思吗?

使用道具

14
xiangxinziji917 发表于 2017-1-11 17:29:27 |只看作者 |坛友微信交流群
tony2040044 发表于 2015-3-7 14:39
这个问题,最好的办法就是不要删,而是把无效的replace成.

这样处理起来灵活,免了很多重复的工作
请问下处理成.是什么意思啊?stata中设置NA值就是缺失值的意思吗?

使用道具

15
jinyuguo 发表于 2017-1-11 17:40:14 |只看作者 |坛友微信交流群
有缺失值的样本点,被默认为是无效观测,不加入回归。不管是何类型数据,插补有当然是可以作的。但我不提倡(除非样本太小)。因为如果连原始数据都需要插补,后续回归还可信吗?

使用道具

16
zabbyy 发表于 2017-7-11 01:27:03 |只看作者 |坛友微信交流群
jinyuguo 发表于 2017-1-11 17:40
有缺失值的样本点,被默认为是无效观测,不加入回归。不管是何类型数据,插补有当然是可以作的。但我不提倡 ...
赞同。
同样的,缺失值替换为零的,也是有问题的。比如XXX市的2013年的gdp缺失,替换为零是否太草率了点呢

使用道具

17
规划和健康10 学生认证  发表于 2017-9-2 16:45:36 |只看作者 |坛友微信交流群
ermutuxia 发表于 2014-11-7 16:01
如果某一个变量的缺失值特别多建议回归方程中就不要加入这个变量了,因为回归的时候用的是所有变量都不缺失 ...
赞!

使用道具

18
胡不歸 发表于 2018-4-1 22:05:44 |只看作者 |坛友微信交流群
马克一下

使用道具

19
日新少年 学生认证  发表于 2018-4-1 23:39:51 |只看作者 |坛友微信交流群
ermutuxia 发表于 2014-11-7 16:01
如果某一个变量的缺失值特别多建议回归方程中就不要加入这个变量了,因为回归的时候用的是所有变量都不缺失 ...
谢谢分享

使用道具

谢谢分享!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-6 11:39