附件里的数据,大部分在网上都可以找得到,但是一来不系统,二来需要花费大量的时间和精力去整理,因写论文需要,花了很长时间整理了网上的省级面板数据,并附有详细说明。在这些文件中,可以看到原始的数据是如何一步步的变成所需的面板数据的,在数据整理的过程中,可以看到有些不太常见的数据处理小技巧,当然这些小技巧对于大神来说不算什么,但对于刚上手的小白来说,仔细阅读,可以少走很多弯路,希望可以帮助有需要的朋友,主要数据如下:
一、指标总数:
2000到2018年共计16个省级面板指标,分别为:实际GDP、货物周转量、就业人数、专利授权量、城镇化率、城乡收入差距、市场化进程、PM2.5、网络普及率、进出口总额、研发支出、技术市场成交额、财政支出、能源消耗、固定资产投入、人均受教育年限。
二、全数据指标:
全数据指标是指原始数据年份较全的指标,没有经过数据清洗和处理的指标,主要有:实际GDP、货物周转量、就业人数、城乡收入差距、固定资产投入。
三、数据处理指标:
因为一些年份缺失,或本人能力和资源有限,未能将全部年份数据补齐,有些部分缺失的数据,经过本人做了一些合理化的推测和数据处理,处理过的数据都进行了标红处理,方便朋友们有真实的数据进行替代。主要有以下指标,分别详述如下:
1、就业人数
我拿到的就业人数数据是2000到2018年的数据,但是2018年有部分省份数据缺失,我使用插值法把前一年的数据放到2018年,之所以没有考虑按照GDP增长率进行处理,是基于目前中国总人数增长比例不高,且人均效率有提升的考虑。在单独的附表里面,除了处理过的面板数据外,还有一二三产分别的就业数据,可以用来分析各产业的就业人数比例。截图如下:
2、专利授权量
专利授权量主要用插值法补齐数据,如有最新数据,可以交流,主要缺失数据的部分截图如下:
3、城镇化率
主要缺失的是西藏的数据,可能是之前写资料删掉了。
4、市场化进程
缺失18年的数据,使用的是前17年均值加17年基数的方式补齐数据。
5、PM2.5
缺失2017到2018年的数据,通过趋势预测方式补齐数据,可以沟通交流。
6、网络普及率
该指标数据2001到2004、2017、2018数据缺失,使用趋势预测方式补齐数据,如有最新数据,可以沟通交流。
7、进出口总额
缺失2018年的数据,采用GDP同比增长法补齐数据,单独的指标附表里,有进口、出口和进出口总额的三项指标数据。
8、研发支出的数据缺少2016到2018年的,使用GDP同比增长法补齐数据。
9、技术市场成交额
缺少2018年的数据,采用GDP同比增长法补齐数据。。
10、财政支出
缺少2000和2018年的数据,采用GDP同比增长法补齐数据。
11、能源消耗
缺少2018年的数据,采用GDP同比增长法补齐数据。
12、人均受教育年限
缺少2000、2018年的数据,采用回归预测法补齐数据。
四、关于面板数据的其他说明:
附件表格分为原始数据指标汇总表格、经处理的面板数据汇总表格(经过处理的分指标面板数据和汇总的面板数据,方便数据进行组合和拆分。)单独的各项指标表格(一些单独的指标表格有含有原始数据,已在上面做详细说明)。在每个表格的数据下面都有相应的数据来源,数据指标的解释和含义请参考百度,未做详细说明。具体分项表格和汇总表格见截图。
以上数据均没有进行1%缩尾处理,如果想进行缩尾处理,可以在stata里使用缩尾命令:具体如下:
ssc install winsor2,replace
winsor2 VARS cuts(1,99)
顺便给经管之家做个广告,关注经管世界公众号,在后台回复stata,可下载各版本的stata,我就是在这上面下载的,但是要注意按照最新的方式下载安装。
我在网上搜了一些关于用Excel预测最新几期缺失数据的方法,我推荐最后一种,用图表趋势预测数据值,对做回归分析的影响较小。
https://jingyan.baidu.com/article/84b4f565a6194560f6da3231.html
https://blog.csdn.net/lihongyingaaa/article/details/80617953
https://www.pig66.com/Excel/2019/0509/1373244.html
https://baijiahao.baidu.com/s?id=1601753904103065748&wfr=spider&for=pc
https://jingyan.baidu.com/article/ed15cb1b5c67781be3698121.html
如果有朋友能将缺失的数据补上或者指正错误的数据,可以根据需要双方交换所需数据(还有许多未上传数据),共同进步。
各指标及汇总数据如下:
网盘下载全部数据.txt
(147 Bytes, 需要: RMB 98 元)
汇总2000到2018年省级整理面板数据.xlsx
(815.07 KB, 需要: RMB 80 元)
汇总2000到2018省级原始数据.xlsx
(191.26 KB, 需要: RMB 64 元)
2000到2018省级网络普及率.xlsx
(38.75 KB, 需要: RMB 8 元)
2000到2018省级市场化进程.xlsx
(63 KB, 需要: RMB 8 元)
2000到2018省级人均受教育年限.xlsx
(72.67 KB, 需要: RMB 8 元)
2000到2018省级能源消耗.xlsx
(45.61 KB, 需要: RMB 8 元)
2000到2018省级技术市场成交额.xlsx
(93.03 KB, 需要: RMB 8 元)
2000到2018省级固定资产投入.xlsx
(141.77 KB, 需要: RMB 8 元)
2000到2018省级城镇化率数据.xlsx
(36.71 KB, 需要: RMB 8 元)
2000到2018省级城乡收入差距.xlsx
(55.88 KB, 需要: RMB 8 元)
2000到2018省级1到3产就业人数.xlsx
(68.94 KB, 需要: RMB 8 元)
2000到2018年省级实际GDP.xlsx
(55.21 KB, 需要: RMB 8 元)
2000到2018年省级进出口总额数据.xlsx
(85.88 KB, 需要: RMB 8 元)
2000到2018年省级货物总周转量.xlsx
(73.63 KB, 需要: RMB 8 元)
2000到2018财政支出数据.xlsx
(49.5 KB, 需要: RMB 8 元)
2000到2018PM2.5数据.xlsx
(63.05 KB, 需要: RMB 8 元)


雷达卡







京公网安备 11010802022788号







