楼主: yinpeiwei
25050 14

[学习心得] 缺失值的处理方法——一个较为全面的文献梳理 [推广有奖]

  • 1关注
  • 12粉丝

已卖:915份资源

副教授

35%

还不是VIP/贵宾

-

威望
0
论坛币
5357 个
通用积分
393.9026
学术水平
2 点
热心指数
8 点
信用等级
0 点
经验
16347 点
帖子
445
精华
0
在线时间
747 小时
注册时间
2010-4-13
最后登录
2024-8-20

楼主
yinpeiwei 在职认证  发表于 2021-8-9 16:59:41 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在使用面板数据集时,常常遇到个别年份个别指标缺失,为了实现平衡面板,文献中有多种处理方法:①是线性插值法(汤凯,2020;唐娟等,2020;欧进锋等,2020);②利用数据缺失值前后年份的平均值做替代(郑秀娟,2018;鲁玉秀等,2021);③移动平均法(陶长琪和徐茉,2021)。④对于数值型特征使用平均值来填充,类别型特征使用众数来填充(刘楷林和尚培培,2021)。⑤人工填写方式(许永兵和罗鹏,2020)。“由于河北省尚未出版2019年经济年鉴,导致部分城市部分指标缺失,因此采用人工填写方式,以指标数据的变化趋势和对比水平为依据。”⑥采用序列均值的方法进行填补(王婷等,2020)。“因统计原因缺少的个别城市的数据已通过spss中序列均值的方法进行填补”。⑦按比例换算法。江西省 2007 年、2008 年两年地级市的土地出让数据缺失,我们以 2006 年和 2009 年各地级市土地出让收入占全省比例的平均值再乘以当年全省土地出让总收入得到(邵朝对等,2016)。⑧线性趋势外推法(高志刚和张毅,2021)。⑨个别城市缺失数据用近3年平均增长率进行补值处理(程德智和王满仓,2021)。

持续补充中。

参考文献:
汤凯.我国临空经济区对地区经济增长的影响——基于离散型空间溢出效应[J].中国流通经济,2020,34(8):81-90.
唐娟, 秦放鸣,唐莎.中国经济高质量发展水平测度与差异分析[J]. 统计与决策,2020, 36(15):5-8.
郑秀娟.基于随机前沿的物流业发展效率及区域差异分析[J].统计与决策,2018,34(18):121-124.
鲁玉秀,方行明,张安全.数字经济、空间溢出与城市经济高质量发展[J].经济经纬,2021,38(6):21-31.
陶长琪,徐茉.经济高质量发展视阈下中国创新要素配置水平的测度[J]. 数量经济技术经济研究,2021, 38(3):3-22.
刘楷琳,尚培培.中国城市群高质量发展水平测度及空间关联性[J].东北财经大学学报,2021(3):37-46.
许永兵,罗鹏.京津冀城市群的经济发展质量评价[J].河北大学学报(哲学社会科学版),2020,45(4):85-98.
王婷, 廖柔玲,孙杰.广东省城市经济高质量发展水平测度研究[J].市场论坛,2020(11):54-60.
欧进锋, 许抄军,刘雨骐.基于“五大发展理念”的经济高质量发展水平测度——广东省21个地级市的实证分析[J].经济地理,2020,40(6):77-86.
邵朝对, 苏丹妮,邓宏图.房价、土地财政与城市集聚特征:中国式城市发展之路[J].管理世界,2016(2):19-31+187.
高志刚,张毅.区域经济差距对西部地区经济高质量发展的影响研究[J].宁夏社会科学,2021(1):99-110.
程德智,王满仓.黄河流域金融集聚对区域高质量发展的影响[J].中国人口·资源与环境,2021,31(08):137-147.




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:处理方法 缺失值 中国流通经济 流通经济 地区经济 线性插值法

沙发
shen4583 发表于 2021-11-22 13:56:58
好东西!

藤椅
两颗枣树下 学生认证  发表于 2021-12-19 16:07:09
老板有心了感谢

板凳
香蕉ccc 发表于 2022-2-10 20:50:45
你好,请问用近三年平均增长率补充数据用哪个公式比较好?举个例子,假如2019年以前数据都知道,2019年数据缺失,用该方法(平均增长率+1)×2018年数据=2019年数据,但是平均增长率的算法现在有两种:一种是(2016年的增长率+2017年增长率+2018年增长率)➗3  另一种是2018年数据除以2015年数据开三次方-1  ,求解平均增长率该用哪一个???

报纸
yinpeiwei 在职认证  发表于 2022-2-10 21:29:01
香蕉ccc 发表于 2022-2-10 20:50
你好,请问用近三年平均增长率补充数据用哪个公式比较好?举个例子,假如2019年以前数据都知道,2019年数据 ...
这是个很好的问题,等待高手解答呀。一个是算术平均,一个是几何平均。我会选择算术平均。我没实际处理过,抱歉。

地板
yinpeiwei 在职认证  发表于 2022-7-17 13:38:37
石大千等(2018,中国工业经济)提到,部分地级市部分年份存在数据缺失,本文利用平均增长率方法将其补齐,最终得到2005-2015年中国197个地级市11年的平衡面板数据。(此外,作者并未明确是几年一平均,不过,思路可以借鉴)。

7
yjc777 发表于 2022-7-20 20:33:50
yinpeiwei 发表于 2022-7-17 13:38
石大千等(2018,中国工业经济)提到,部分地级市部分年份存在数据缺失,本文利用平均增长率方法将其补齐, ...
我感觉他这篇文章数据有问题,

8
yinpeiwei 在职认证  发表于 2023-1-30 18:38:05
周阳(2012,城市观察_AMI扩展)研究中指出,数据以2010年为主,当2010年的数据无法获取时,采用2009年的数据。

9
yinpeiwei 在职认证  发表于 2023-2-14 17:24:54
钞小静和任保平(2011,经济研究)提到,“缺失数据的处理通过建立回归方程的方法,运用已有数据进行估测”。

10
LittleRedandyou 发表于 2023-6-9 12:06:06
老师,您阅读文献广泛,我想请问,按比例法来补缺失值的参考文献还有没有其他的呢?就是差不多用总的省份的数据推地级市的数据的参考文献。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-9 06:59