楼主: xisha216
1381 3

[其他] 数据缺失 [推广有奖]

  • 0关注
  • 1粉丝

已卖:7份资源

硕士生

84%

还不是VIP/贵宾

-

威望
0
论坛币
1114 个
通用积分
0
学术水平
4 点
热心指数
2 点
信用等级
3 点
经验
4200 点
帖子
167
精华
0
在线时间
142 小时
注册时间
2012-9-13
最后登录
2014-6-3

楼主
xisha216 发表于 2013-9-22 20:15:29 |AI写论文
50论坛币
请问,数据统计数据时,有的变量的数据缺失,那么数据到底缺失到什么程度,这个变量就不能计入数据实证了呢?
比如说:一个变量有30个样本数据,如果这个变量的样本数据缺失多少个,那么这个变量就不能实证了呢?5个?10个?12个?15个?

最佳答案

ehelloe 查看完整内容

30个样本本身就少,如有缺失如何保证分析结果的可靠性? 30个样本,缺失5个,就是1/6的缺失率。根本就不必做了!做了也没有什么意义
关键词:数据缺失 样本数据 数据统计 统计数据 样本数 统计 样本

沙发
ehelloe 发表于 2013-9-22 20:15:30
30个样本本身就少,如有缺失如何保证分析结果的可靠性?
30个样本,缺失5个,就是1/6的缺失率。根本就不必做了!做了也没有什么意义

藤椅
ehelloe 发表于 2013-9-22 20:54:24
如果是300个样本,缺失30个,还勉强可接受。

板凳
ehelloe 发表于 2013-9-22 22:08:50
这位朋友,谢谢啊!
我答复你的问题,本不为金币而来——我答的时候,也没有看清这是个悬赏帖子。也只是简单回答了下。

有关数据缺失值的问题,还会有更完整科学的答案。你自己也可以查一下有关统计学著作。
我这里先加一个:如果你是做有关宏观数据的统计分析,记得我的计量经济老师讲过,也就几十年的数据,尽量不要缺失。不行,就要将包含缺失值的样本删除(也就是年份数据),那就需要缩小研究时期。如想要做从1949-2012年的研究,一般都会将文革时期排除在外,那就最好从改革开放之后研究。

此外,如果样本中仅有个别变量出现缺失,只要这个变量不是重要变量(如重要的自变量与因变量),就可以将此变量删除。当然,最好不影响你的理论假设。还有性别变量如出现缺失,基本上采取的是删除方法。因为缺失值用均值来替代也没有意义,也会扭曲统计上的解释。
希望能帮到你。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-29 08:44