楼主: rictan
15190 3

[数据管理求助] 离群值检验和处理 [推广有奖]

已卖:385份资源

教授

27%

还不是VIP/贵宾

-

威望
0
论坛币
1809 个
通用积分
4.7975
学术水平
2 点
热心指数
9 点
信用等级
1 点
经验
22940 点
帖子
592
精华
0
在线时间
1604 小时
注册时间
2007-4-19
最后登录
2024-10-1

楼主
rictan 发表于 2013-9-18 19:00:51 |AI写论文
20论坛币
请教一下,
我的情况是,跨国面板,11年的数据。
怎么检验是否存在离群值呢?是要针对不同国家来检验离群值(比如,先对中国某个变量的11年数据来进行检验),还是总体不分国家来检验呢?我的感觉是:由于国家不同,那么可能出现同一变量存在明显的差异,比如,适龄人口高等教育入学率,美国高达10%,而南非仅约10%;它们放在一起来检验是否有离群值,会不会有问题呢?
很急用,敬请指点,非常谢谢啊!!!

最佳答案

xingxf 查看完整内容

其实你自己已经给自己答案了。你为什么不两种方法都试试呢? 不处理outlier,按国家处理outlier,按总样本处理outlier,你分别回归出结果,比较一下。把最理想的结果显示出来,其它的的结果作为robustness test啊。 还一个重要问题事你如何处理outlier,你是删除还是winsorization,这个你要试试看,winsor不减少观察值,是现行比较常用的方法。另外,你把多大比例的数据作为outlier也很重要,一般来讲,数据两端不要超过5%,也就 ...
关键词:离群值 高等教育 对中国 入学率 在一起 高等教育 中国 美国 国家

沙发
xingxf 发表于 2013-9-18 19:00:52
其实你自己已经给自己答案了。你为什么不两种方法都试试呢?
不处理outlier,按国家处理outlier,按总样本处理outlier,你分别回归出结果,比较一下。把最理想的结果显示出来,其它的的结果作为robustness test啊。
还一个重要问题事你如何处理outlier,你是删除还是winsorization,这个你要试试看,winsor不减少观察值,是现行比较常用的方法。另外,你把多大比例的数据作为outlier也很重要,一般来讲,数据两端不要超过5%,也就是不超过总样本的10%。数据两端1%,2%,3%都很常见。

藤椅
xinxin^_^ 发表于 2016-4-24 23:41:11
xingxf 发表于 2013-9-18 19:00
其实你自己已经给自己答案了。你为什么不两种方法都试试呢?
不处理outlier,按国家处理outlier,按总样本 ...
谢谢!

板凳
燃耗度 发表于 2018-5-22 12:09:27
您好,请问如何按国家处理outliner呀?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-4 01:34