楼主: rictan
14282 3

[数据管理求助] 离群值检验和处理 [推广有奖]

教授

27%

还不是VIP/贵宾

-

威望
0
论坛币
1809 个
通用积分
4.7649
学术水平
2 点
热心指数
9 点
信用等级
1 点
经验
22940 点
帖子
592
精华
0
在线时间
1603 小时
注册时间
2007-4-19
最后登录
2022-5-20

20论坛币
请教一下,
我的情况是,跨国面板,11年的数据。
怎么检验是否存在离群值呢?是要针对不同国家来检验离群值(比如,先对中国某个变量的11年数据来进行检验),还是总体不分国家来检验呢?我的感觉是:由于国家不同,那么可能出现同一变量存在明显的差异,比如,适龄人口高等教育入学率,美国高达10%,而南非仅约10%;它们放在一起来检验是否有离群值,会不会有问题呢?
很急用,敬请指点,非常谢谢啊!!!

最佳答案

xingxf 查看完整内容

其实你自己已经给自己答案了。你为什么不两种方法都试试呢? 不处理outlier,按国家处理outlier,按总样本处理outlier,你分别回归出结果,比较一下。把最理想的结果显示出来,其它的的结果作为robustness test啊。 还一个重要问题事你如何处理outlier,你是删除还是winsorization,这个你要试试看,winsor不减少观察值,是现行比较常用的方法。另外,你把多大比例的数据作为outlier也很重要,一般来讲,数据两端不要超过5%,也就 ...
关键词:离群值 高等教育 对中国 入学率 在一起 高等教育 中国 美国 国家
沙发
xingxf 发表于 2013-9-18 19:00:52 |只看作者 |坛友微信交流群
其实你自己已经给自己答案了。你为什么不两种方法都试试呢?
不处理outlier,按国家处理outlier,按总样本处理outlier,你分别回归出结果,比较一下。把最理想的结果显示出来,其它的的结果作为robustness test啊。
还一个重要问题事你如何处理outlier,你是删除还是winsorization,这个你要试试看,winsor不减少观察值,是现行比较常用的方法。另外,你把多大比例的数据作为outlier也很重要,一般来讲,数据两端不要超过5%,也就是不超过总样本的10%。数据两端1%,2%,3%都很常见。

使用道具

藤椅
xinxin^_^ 发表于 2016-4-24 23:41:11 |只看作者 |坛友微信交流群
xingxf 发表于 2013-9-18 19:00
其实你自己已经给自己答案了。你为什么不两种方法都试试呢?
不处理outlier,按国家处理outlier,按总样本 ...
谢谢!

使用道具

板凳
燃耗度 发表于 2018-5-22 12:09:27 |只看作者 |坛友微信交流群
您好,请问如何按国家处理outliner呀?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-28 06:24