楼主: luue
9290 9

[面板数据求助] 请问拿到一份数据是先处理离群值还是先处理缺漏值? [推广有奖]

  • 1关注
  • 1粉丝

已卖:480份资源

博士生

4%

还不是VIP/贵宾

-

威望
0
论坛币
1234 个
通用积分
44.5868
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2175 点
帖子
47
精华
0
在线时间
382 小时
注册时间
2013-3-2
最后登录
2025-11-23

楼主
luue 发表于 2015-10-13 12:48:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
离群值和缺漏值貌似要么删了要么都可以用均值代替,可是谁先谁后呢?
先用均值替补缺漏值的话,离群值会对均值有影响;先处理离群值的话,那些缺漏值太多的个体(面板里的城市、公司)似乎应该先删去,so,数据处理孰先孰后?
还有一个问题,用均值代替缺漏值合不合理?因为个体差异实在太大,比如几个大城市的数据肯定抬高了均值,这样的均值放在小城市的缺漏值里肯定不合适吧,这种情况怎么处理呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:离群值 缺漏值 个体差异 怎么处理 数据处理 影响

回帖推荐

xddlovejiao1314 发表于2楼  查看完整内容

我仔细的想了想,如果我遇到和楼主一样的问题,会怎么处理。 既然是面板数据(有N有T),那么样本量是N*T,如果样本量比较大,我就先把缺漏值给处理了(删掉缺漏值样本),再处理离群值;如果样本量不大,则我先对缺漏值进行处理,然后再处理离群值。这时,在处理缺漏值时,我不用总体均值填充,因为就像楼主说的如果这样填充会受极端异常值影响,会把均值拉升。这时,我用样本中位数去填充缺漏值,或者是面板数据,我用缺漏 ...

沙发
xddlovejiao1314 学生认证  发表于 2015-10-13 14:03:02
   我仔细的想了想,如果我遇到和楼主一样的问题,会怎么处理。
   既然是面板数据(有N有T),那么样本量是N*T,如果样本量比较大,我就先把缺漏值给处理了(删掉缺漏值样本),再处理离群值;如果样本量不大,则我先对缺漏值进行处理,然后再处理离群值。这时,在处理缺漏值时,我不用总体均值填充,因为就像楼主说的如果这样填充会受极端异常值影响,会把均值拉升。这时,我用样本中位数去填充缺漏值,或者是面板数据,我用缺漏个体已有的数据做个回归去拟合缺漏值。
   总结而言,我的思路都是先处理缺漏值,再处理离群值。祝好运~
已有 2 人评分经验 学术水平 热心指数 信用等级 收起 理由
luue + 1 + 1 + 1 精彩帖子
夏目贵志 + 10 + 1 + 1 热心帮助其他会员

总评分: 经验 + 10  学术水平 + 2  热心指数 + 2  信用等级 + 1   查看全部评分

藤椅
tkt718 发表于 2015-10-13 20:51:08 来自手机
xddlovejiao1314 发表于 2015-10-13 14:03
我仔细的想了想,如果我遇到和楼主一样的问题,会怎么处理。
   既然是面板数据(有N有T),那么样本量 ...
厉害!!!!

板凳
夏目贵志 发表于 2015-10-14 23:29:29
处理缺失值的方法很讲究,每个研究都会不同。如果搞得不好很容易引起争议导致被退稿。一定要小心。

报纸
luue 发表于 2015-10-15 14:44:05
xddlovejiao1314 发表于 2015-10-13 14:03
我仔细的想了想,如果我遇到和楼主一样的问题,会怎么处理。
   既然是面板数据(有N有T),那么样本量 ...
谢谢您的回复!但是无论是用中位数还是用模型回归,异常值的存在还是会有影响吧~

地板
xddlovejiao1314 学生认证  发表于 2015-10-15 14:49:01
luue 发表于 2015-10-15 14:44
谢谢您的回复!但是无论是用中位数还是用模型回归,异常值的存在还是会有影响吧~
就是因为存在极端异常值,所以考虑用中位数,因为中位数的算法是先对数据排序,再取最中间的数。而均值受极端异常值的影响更大些。

7
luue 发表于 2015-10-15 14:49:30
夏目贵志 发表于 2015-10-14 23:29
处理缺失值的方法很讲究,每个研究都会不同。如果搞得不好很容易引起争议导致被退稿。一定要小心。
我看有人是直接删去要么不管它,可惜我用的是差分法,删去缺漏值再差分样本就小的可怜了!唉~

8
是邓邓呀 发表于 2020-3-27 18:54:49
xddlovejiao1314 发表于 2015-10-13 14:03
我仔细的想了想,如果我遇到和楼主一样的问题,会怎么处理。
   既然是面板数据(有N有T),那么样本量 ...
老师您好,请问一下拿到一组数据是先离群值处理还是先进行加减乘除运算呢?

9
我要我的滋味sd 发表于 2023-11-13 15:08:35
xddlovejiao1314 发表于 2015-10-13 14:03
我仔细的想了想,如果我遇到和楼主一样的问题,会怎么处理。
   既然是面板数据(有N有T),那么样本量 ...
感谢你的建议,很受用!!!

10
我要我的滋味sd 发表于 2023-11-13 15:09:18
我也遇到了同样疑问,看了你的帖子,很受用

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 05:46