楼主: 有福有德
13553 58

[学习分享] 稳健性问题   [推广有奖]

教师

院士

6%

还不是VIP/贵宾

-

威望
4
论坛币
56500 个
通用积分
8.4735
学术水平
344 点
热心指数
203 点
信用等级
274 点
经验
37400 点
帖子
1138
精华
10
在线时间
945 小时
注册时间
2010-10-14
最后登录
2024-3-21

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

描述性统计中一般用于描述数据整体状况的指标,包括集中性、离散性的统计量,对应于稳健性问题中,这两个指标为位置统计量和尺度统计量。

一般来说,当数据显严格正态分布时,报告均值和标准差基本就可以全面的描述数据了,然而如果数据峰度或偏度有严重问题,那么这两个统计量的局限就显而易见了,一般建议报告,位置统计量:中位数或M估计量等;尺度统计量:中位绝对离差、双权中位方差等。

另外帮助分析人员更好的了解数据(存在大量异常值或严重偏态的情况)的方法还有,稳健统计量,例如trimmed与winsorized的方法。

proc univariate data=data_anl.performance

                    trimmed=.1 winsorized=.1 robustscale;

   var gcharacteristic;

   id id;

run;

*trimmed:截掉尾端10%的观测值;

*winsorized: 截掉尾端不同比例(10%)的观测值,使用其最近的观测值替代;

*robustscale:输出尺度(scale)的稳健估计;

1.png

推论统计中,稳健模型的常用的方法有稳健方差、回归等模型,广义线性模型(目前不够成熟)。

下面看一下SAS常用的稳健估计方法

从下面的4种估计方法中,可以很容易看出这些方法都存在效率问题。所以经验认为,对一组数据的异常(包括不同程度的异常值,或不同程度的偏态),如果分析人员有足够的能力处理的话,尽量使用传统方法估计,例如OLS,否则就直接使用稳健方法。

/*   breakdown_point   influence_function   relative_efficiency   

m          0                bounded               95%  

mm         0.5              bounded               95%  

s          0.5              bounded               33%  

lts        0.5              bounded               8%  

使用条件:

1)m没有考虑杠杆效应,但对于厚尾分布的误差、异方差、y异常值具有稳健性。

2)lts、s效率太低,建立联合使用;

3)mm:推荐使用。参见SAS9.3手册*/

proc robustreg data=data_anl.performance method=mm;

     model gcharacteristic=jaim jhonour jpromotion;

run;

* robustreg的主要过程,method=mm指定的方法;

对于模型评价的方法,一般建议参考鲁索1990的建议;

模拟一份数据产生不同比例的异常观测值

data a;

   do i=1 to 100;

      x=rannor(123);

      e=rannor(123);

            *y=5+3*x+0.3*e;

            if i>80 then y=3+e;

                 else y=5+3*x+0.3*e;

         output;

   end;

run;

将模型残差保存下来,绘制矩阵散点图。可以看出四种稳健估计的残差较一致,但OLS估计和其他方法相比就出现的较大的不一致。以上是存在20%的异常信息。

2.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:稳健性 性问题 performance Univariate EFFICIENCY 统计 正态分布 中位数 标准差

已有 12 人评分经验 威望 论坛币 学术水平 热心指数 信用等级 收起 理由
eijuhz + 2 精彩帖子
casboryy + 5
hongking + 1 + 1 + 1 奖励积极上传好的资料
sangjy + 1 + 1 + 1 对论坛有贡献
黑暗的造访 + 1 + 1 精彩帖子
真实精算 + 1 + 1 + 1 精彩帖子
blueskyxo + 1 + 1 + 1 精彩帖子
水上人间 + 1 + 1 + 1 热心帮助其他会员
wyx630422857 + 1 + 1 精彩帖子
admin + 1 感谢您长久以来对论坛的支持

总评分: 经验 + 60  威望 + 1  论坛币 + 60  学术水平 + 18  热心指数 + 11  信用等级 + 9   查看全部评分

本帖被以下文库推荐

所有模型都是错的
沙发
Phaor 发表于 2013-5-27 17:58:04 |只看作者 |坛友微信交流群
好文!

使用道具

藤椅
ChamBravezy 发表于 2013-5-27 18:43:55 |只看作者 |坛友微信交流群
没用过SAS,但直觉告诉我,楼主发来的应该是好东西,牛,好!

使用道具

板凳
ChamBravezy 发表于 2013-5-27 18:44:02 |只看作者 |坛友微信交流群
没用过SAS,但直觉告诉我,楼主发来的应该是好东西,牛,好!

使用道具

报纸
dragon816 发表于 2013-5-27 18:57:00 |只看作者 |坛友微信交流群
实话实说,看不懂。。。
时间就像乳沟,只要挤总是会有的!

使用道具

地板
boe 发表于 2013-5-28 13:01:06 |只看作者 |坛友微信交流群
good to learn,thanks!!!
Gorgeous girl , I love !

使用道具

7
Jackywolf_2008 发表于 2013-5-29 13:59:16 |只看作者 |坛友微信交流群

使用道具

8
apucng 发表于 2013-5-30 12:31:51 |只看作者 |坛友微信交流群
判断outliers有些检验方法,比如学生化残差,Cook'D,DFITS
另外根据Vincenzo Verardi and Christophe Croux(2009)的模拟,mm方法在70%效率下比95%效率下估计量bias和mse更小,看起来95%反而会产生不太理想的结果。。
虽然没用过SAS,顶下LZ
路漫漫其修远兮,吾将上下而求索

使用道具

9
treky 发表于 2013-5-30 12:40:35 |只看作者 |坛友微信交流群
没看懂,多学习!

使用道具

10
qingbo0221 发表于 2013-5-30 12:56:08 |只看作者 |坛友微信交流群

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 14:09