楼主: mmnu
2582 8

[数据管理求助] 对极端值可以改成均值再回归吗? [推广有奖]

  • 0关注
  • 0粉丝

本科生

46%

还不是VIP/贵宾

-

威望
0
论坛币
19 个
通用积分
30.3045
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
798 点
帖子
47
精华
0
在线时间
88 小时
注册时间
2011-11-12
最后登录
2023-10-21

楼主
mmnu 发表于 2015-4-10 22:33:52 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我又来问问题了
每次都得到大家耐心解答很感谢。

所有样本年平均收入5000左右。
个别样本出现200,300这样的收入
我认为是数据输入错误,因为同一个人以前年份的收入没有这么少,在2000,3000左右
那么我可不可以偷偷*10呢?或者改成均值呢?
如果把这个我认为奇怪错误的数据删除,结果就比较不好解释
如果偷偷改一下,会是我期待的结果

请问,可以改吗?
现在的想法就是能改就不删。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:极端值 平均收入 数据输入 年平均 样本 左右

沙发
crystal8832 学生认证  发表于 2015-4-10 23:04:51
有个winsor命令 您是否晓得?
已有 1 人评分经验 收起 理由
SpencerMeng + 100 观点有启发

总评分: 经验 + 100   查看全部评分

藤椅
jose.liupei 发表于 2015-4-11 01:05:00
winsor可以根据标准修改极端值,不要“偷偷”改~^_^

板凳
mmnu 发表于 2015-4-11 13:47:53
crystal8832 发表于 2015-4-10 23:04
有个winsor命令 您是否晓得?
不知道
我的stata11里面也没有
findit了一下需要装
也不会用

报纸
quetiony 发表于 2015-4-11 14:01:05
你也可以設定條件去做刪除的動作,但前提是你必須給出一個理由來說明為何要刪掉這樣的資料

例如你可以說 因為XXXXX,你不討論年平均收入低於500的人,故刪除這樣的資料。
指令如下:
drop if 年平均收入<500

地板
mmnu 发表于 2015-4-11 14:08:48
jose.liupei 发表于 2015-4-11 01:05
winsor可以根据标准修改极端值,不要“偷偷”改~^_^
试了一下,如果h(3)就是把最大最小的三个样本的数值改成了第四大第四小的值
这样合理?

7
mmnu 发表于 2015-4-11 14:18:13
quetiony 发表于 2015-4-11 14:01
你也可以設定條件去做刪除的動作,但前提是你必須給出一個理由來說明為何要刪掉這樣的資料

例如你可以說 ...
最小的四个数值都有问题啊,
理由就是,结合年龄,职业职位行业年收不可能这么少。
而且同一个人前三年的收入都没有这么少,都是今年的10倍左右,而且跟平均值差的也很多
如果删除的话,最后的结果非常不好解释
我是想改数值。*10
但是就是不知道可不可以这样改。

8
crystal8832 学生认证  发表于 2015-4-11 18:56:02
mmnu 发表于 2015-4-11 13:47
不知道
我的stata11里面也没有
findit了一下需要装
缩尾技术,这个很常用的,也很简单,可以看下帮助文件

9
jose.liupei 发表于 2015-4-12 07:26:37
mmnu 发表于 2015-4-11 14:08
试了一下,如果h(3)就是把最大最小的三个样本的数值改成了第四大第四小的值
这样合理?
还是那句话:修改或者删除数据总得有个标准或者有个依据(要么根据分布来选,比如截取分布前后1%的数据;要么根据实际经验来给出标准,比如总资产不能小于0;或者其他标准),总不能你认为想修改哪些就修改哪些

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-3 04:19