楼主: cgegmm
4041 1

[问答] 请教各位大侠,如何处理缺失数据 [推广有奖]

  • 0关注
  • 1粉丝

本科生

90%

还不是VIP/贵宾

-

威望
0
论坛币
3967 个
通用积分
0.0024
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1201 点
帖子
68
精华
0
在线时间
166 小时
注册时间
2005-10-18
最后登录
2022-11-10

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

1第一种情况,这个数据是客观存在的,但是没有得到统计值,比如说1930年的GDP

2第二种情况,51长假股票市场并不交易,那么这天的价格如何处理,直接去掉

还是沿用4月30日的价格?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:各位大侠 缺失数据 股票市场 GDP 存在的 数据 大侠 缺失

先回复你的问题再引入具体的一些处理方法(供参考)
1.缺少1930的GDP:如果你的数据时年度数据,而且不是从1930开始的,可以根据前几期后后几期的数据做估计预测来填补。另外,如果1930年缺少的不只是GDP,还有其他的数据,而且你的数据量也很大,那么也可以考虑删除的。
2.我个人认为不适合用4.30的价格沿用,因为金融交易数据的波动比较大,同时国定长假还有十一之类的,建议还是去除掉。对于周末之类的,我知道Eviews中有五日的数据模式可以导入,但是这个是按照西方的计算,也就是春节之类的中国假日是无法识别的。

最后针对缺失值的处理,找到了一些方法,介绍一下吧:
缺失值处理的传统方法
  • 列删法:将存在缺失值的被试删除。列删法的假设机制是完全随机缺失,在很多情况下很难满足此假设,所以会产生偏差的参数估计。由于删除了非缺失信息,损失了样本量,进而削弱了统计功效。但是,当样本量很大而缺失值所占样本比例较少时(<5%)可以考虑使用列删法,但任然存在上述不足。
  • 对删法:在计算相关矩阵时,用所有可获得的数据计算,不管是否存在缺失值。同列删法一样,对删法的假设机制也是完全随机缺失,在不满足假设时产生估计偏差。由于计算每对相关系数基于差异较大的样本,所以存在协方差矩阵非正定的风险。另外,样本的差异也会使计算标准误产生问题。
  • 均值替代法:使用每个变量的均值去填补该变量的缺失值。这种方法产生估计偏差,最不为方法学者推荐。
  • 回归法:根据变量间的相关,利用其他变量的信息通过建立回归方式去推算缺失值。该法同样会产生估计偏差。
  • 平均同质项目法:假设个体在某一因子的某些条目上存在缺失值,通过平均其他几个条目得分来填补缺失值。这种做法在实际中很常见,但缺陷也很明显。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-29 01:56