楼主: shaoqinglong11
9810 11

[数据管理求助] 如何处理异常值 [推广有奖]

已卖:631份资源

院士

51%

还不是VIP/贵宾

-

威望
3
论坛币
12100 个
通用积分
189.1567
学术水平
323 点
热心指数
357 点
信用等级
246 点
经验
84742 点
帖子
2571
精华
1
在线时间
2575 小时
注册时间
2013-8-21
最后登录
2025-7-15

楼主
shaoqinglong11 发表于 2016-2-10 17:38:23 |AI写论文
20论坛币
样本有164个国家,出现了一些异常值,比如某些小国GDP增长率会在一年之间下降50%,请问如何处理这些异常值?有没有做过异常值处理的文章可以推荐的,谢谢!

最佳答案

夏目贵志 查看完整内容

就像这个例子里这样。这个例子里假定最后一个观测值是异常的。第一个回归是包括异常值的。第二个回归包括dummy,但是结果和不包括异常值的第三个回归是一样的。 sysuse auto reg price weight gen i=_n==74 reg price weight i reg price weight in 1/73
关键词:异常值 GDP增长率 gdp增长 一年之间 GDP 如何

沙发
夏目贵志 发表于 2016-2-10 17:38:24
shaoqinglong11 发表于 2016-2-12 17:40
谢谢,请问如何设置DUMMY变量
就像这个例子里这样。这个例子里假定最后一个观测值是异常的。第一个回归是包括异常值的。第二个回归包括dummy,但是结果和不包括异常值的第三个回归是一样的。
sysuse auto
reg price weight
gen i=_n==74
reg price weight i
reg price weight in 1/73

藤椅
夏目贵志 发表于 2016-2-11 05:25:22
你要用这些数据干什么?你为什么觉得它们异常?判断是否需要处理以及如何处理都是需要具体问题具体分析的。

板凳
shaoqinglong11 发表于 2016-2-11 05:43:00
夏目贵志 发表于 2016-2-11 05:25
你要用这些数据干什么?你为什么觉得它们异常?判断是否需要处理以及如何处理都是需要具体问题具体分析的。
做成散点图有少数的确偏离的很远,导师说要处理,我只好从了

报纸
crysjia 发表于 2016-2-11 11:11:32
我们调查中处理异常值通常是因为可能有因为调查产生的误差,所以导致的异常值。但你那个对于国家的数据,应该是真实值来的吧,为什么是异常值?好比回归曲线那些,不能说离回归曲线远的那些就异常吧,最后显著就可以了。
已有 1 人评分经验 热心指数 收起 理由
夏目贵志 + 5 + 1 热心帮助其他会员

总评分: 经验 + 5  热心指数 + 1   查看全部评分

地板
shaoqinglong11 发表于 2016-2-11 17:38:45
crysjia 发表于 2016-2-11 11:11
我们调查中处理异常值通常是因为可能有因为调查产生的误差,所以导致的异常值。但你那个对于国家的数据,应 ...
我也是和你一样的看法。但是导师是外行,又是我的领导,我能奈何,哎

7
夏目贵志 发表于 2016-2-12 08:55:19
shaoqinglong11 发表于 2016-2-11 17:38
我也是和你一样的看法。但是导师是外行,又是我的领导,我能奈何,哎
那要么就舍掉,不然加个dummy变相舍掉就是了

8
crysjia 发表于 2016-2-12 11:07:14
shaoqinglong11 发表于 2016-2-11 17:38
我也是和你一样的看法。但是导师是外行,又是我的领导,我能奈何,哎
最好好好跟导师或者其他老师交换下意见吧。无论你的题目多有创意,但是过程经不起推敲也会被别人质疑。

9
shaoqinglong11 发表于 2016-2-12 17:40:08
夏目贵志 发表于 2016-2-12 08:55
那要么就舍掉,不然加个dummy变相舍掉就是了
谢谢,请问如何设置DUMMY变量

10
shaoqinglong11 发表于 2016-2-12 17:40:57
crysjia 发表于 2016-2-12 11:07
最好好好跟导师或者其他老师交换下意见吧。无论你的题目多有创意,但是过程经不起推敲也会被别人质疑。
好的,我在尝试去沟通一下

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-26 07:18