楼主: duishuchi
4252 11

[论文写作规范] 数据缺失怎么处理? [推广有奖]

  • 0关注
  • 0粉丝

本科生

29%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.0137
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
170 点
帖子
16
精华
0
在线时间
145 小时
注册时间
2020-6-11
最后登录
2021-7-14

楼主
duishuchi 发表于 2021-6-22 12:39:56 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
收集了一些统计年鉴,还有一些公司的数据,但是有少部分数据存在缺失。除了直接删除之外,我看到spss之类的软件有缺失值处理的功能,但是想问,数据插补之类的缺失值填充,算不算是捏造数据的一种行为?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据缺失 怎么处理 缺失值处理 SPSS 部分数据

沙发
Xucong。 发表于 2021-6-24 14:08:55
具体如果是临近补值和均值法不算的

藤椅
sigtem 在职认证  发表于 2021-6-25 14:20:27
填补缺失数据有很多种方法,常见的可以用0值、均值、中位数、众数、前后邻近值、线性插值等填补。算不算捏造数据这个只能根据具体情况判断,你可以把填补数据方法作为一个假设前提,在论文里先说明,这样就不算捏造了。

板凳
duishuchi 发表于 2021-6-25 15:37:10
sigtem 发表于 2021-6-25 14:20
填补缺失数据有很多种方法,常见的可以用0值、均值、中位数、众数、前后邻近值、线性插值等填补。算不算捏 ...
感谢分享,不过我看好多论文。。数据也很完整,顶多说了一下处理了缺失,都不知道他们怎么处理的

报纸
zhm_beijing 发表于 2021-6-27 15:40:13 来自手机
duishuchi 发表于 2021-6-22 12:39
收集了一些统计年鉴,还有一些公司的数据,但是有少部分数据存在缺失。除了直接删除之外,我看到spss之类的 ...
一种可能:关联时间的数据如果缺失,可能在这个时间点就没有产生数据,分析时是否排除该样本,具体问题具体分析。

地板
run567890 发表于 2021-6-27 20:47:47
在不影响理论和方法的情况下,允许对数据进行假设。

7
郭木木 在职认证  学生认证  发表于 2021-6-27 21:33:33
关于缺失值的处理一般有以下几种:
1、将缺失值删除;
2、将缺失值变为0;
3、将缺失值变为0,同时引入一列虚拟量,令缺失值为1,其余为0.(参见Hausman、Fama等大神)
4、用一些技术填充缺失值,如插值法等。
总结:可以确定一种主要方法,然后用其它方法作为稳健性检验。

8
nieqiang110 学生认证  发表于 2021-6-28 15:53:48
缺失严重的情况下,可以删除该变量;在随机缺失的情况下,可以插值

9
易老师喵了个咪 在职认证  发表于 2021-6-28 18:04:57
如果是插值法、均值法等科学方法去补齐数据,或者说有很强的依据,不算是伪造数据。

10
edo 在职认证  发表于 2021-6-29 10:36:54
通常样本量/数据点足够的话,缺失值就不补齐,直接删除该案例;数据点太少,那只能用想办法补齐了,什么平均值,插值,甚至用回归判别之类的方法,我都用过

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注ddjd
拉您入交流群
GMT+8, 2025-12-29 18:09