楼主: king.ming
7070 9

[经管数据集] 2000到2018年最详细省级面板原始数据与整理数据,附有部分数据处理技巧 [推广有奖]

  • 6关注
  • 29粉丝

已卖:2351份资源

副教授

97%

还不是VIP/贵宾

-

威望
0
论坛币
12570 个
通用积分
362.6868
学术水平
22 点
热心指数
27 点
信用等级
22 点
经验
132261 点
帖子
791
精华
0
在线时间
384 小时
注册时间
2017-4-28
最后登录
2025-12-23

楼主
king.ming 在职认证  发表于 2020-3-21 08:33:47 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

附件里的数据,大部分在网上都可以找得到,但是一来不系统,二来需要花费大量的时间和精力去整理,因写论文需要,花了很长时间整理了网上的省级面板数据,并附有详细说明。在这些文件中,可以看到原始的数据是如何一步步的变成所需的面板数据的,在数据整理的过程中,可以看到有些不太常见的数据处理小技巧,当然这些小技巧对于大神来说不算什么,但对于刚上手的小白来说,仔细阅读,可以少走很多弯路,希望可以帮助有需要的朋友,主要数据如下:

一、指标总数:

2000到2018年共计16个省级面板指标,分别为:实际GDP、货物周转量、就业人数、专利授权量、城镇化率、城乡收入差距、市场化进程、PM2.5、网络普及率、进出口总额、研发支出、技术市场成交额、财政支出、能源消耗、固定资产投入、人均受教育年限。

二、全数据指标:

全数据指标是指原始数据年份较全的指标,没有经过数据清洗和处理的指标,主要有:实际GDP、货物周转量、就业人数、城乡收入差距、固定资产投入。

三、数据处理指标:

因为一些年份缺失,或本人能力和资源有限,未能将全部年份数据补齐,有些部分缺失的数据,经过本人做了一些合理化的推测和数据处理,处理过的数据都进行了标红处理,方便朋友们有真实的数据进行替代。主要有以下指标,分别详述如下:

1、就业人数

我拿到的就业人数数据是2000到2018年的数据,但是2018年有部分省份数据缺失,我使用插值法把前一年的数据放到2018年,之所以没有考虑按照GDP增长率进行处理,是基于目前中国总人数增长比例不高,且人均效率有提升的考虑。在单独的附表里面,除了处理过的面板数据外,还有一二三产分别的就业数据,可以用来分析各产业的就业人数比例。截图如下:

就业人数数据.jpg

2、专利授权量

专利授权量主要用插值法补齐数据,如有最新数据,可以交流,主要缺失数据的部分截图如下:

专利授权量数据.jpg

3、城镇化率

主要缺失的是西藏的数据,可能是之前写资料删掉了。

4、市场化进程

缺失18年的数据,使用的是前17年均值加17年基数的方式补齐数据。

5、PM2.5

缺失2017到2018年的数据,通过趋势预测方式补齐数据,可以沟通交流。

6、网络普及率

该指标数据2001到2004、2017、2018数据缺失,使用趋势预测方式补齐数据,如有最新数据,可以沟通交流。

7、进出口总额

缺失2018年的数据,采用GDP同比增长法补齐数据,单独的指标附表里,有进口、出口和进出口总额的三项指标数据。

8、研发支出的数据缺少2016到2018年的,使用GDP同比增长法补齐数据。

9、技术市场成交额

缺少2018年的数据,采用GDP同比增长法补齐数据。。

10、财政支出

缺少2000和2018年的数据,采用GDP同比增长法补齐数据。

11、能源消耗

缺少2018年的数据,采用GDP同比增长法补齐数据。

12、人均受教育年限

缺少2000、2018年的数据,采用回归预测法补齐数据。

四、关于面板数据的其他说明:

附件表格分为原始数据指标汇总表格、经处理的面板数据汇总表格(经过处理的分指标面板数据和汇总的面板数据,方便数据进行组合和拆分。)单独的各项指标表格(一些单独的指标表格有含有原始数据,已在上面做详细说明)。在每个表格的数据下面都有相应的数据来源,数据指标的解释和含义请参考百度,未做详细说明。具体分项表格和汇总表格见截图。

指标说明图片.jpg

指标说明图片2.jpg

以上数据均没有进行1%缩尾处理,如果想进行缩尾处理,可以在stata里使用缩尾命令:具体如下:

ssc install winsor2,replace

winsor2 VARS cuts(1,99)

顺便给经管之家做个广告,关注经管世界公众号,在后台回复stata,可下载各版本的stata,我就是在这上面下载的,但是要注意按照最新的方式下载安装。

我在网上搜了一些关于用Excel预测最新几期缺失数据的方法,我推荐最后一种,用图表趋势预测数据值,对做回归分析的影响较小。

https://jingyan.baidu.com/article/84b4f565a6194560f6da3231.html

https://blog.csdn.net/lihongyingaaa/article/details/80617953

https://www.pig66.com/Excel/2019/0509/1373244.html

https://baijiahao.baidu.com/s?id=1601753904103065748&wfr=spider&for=pc

https://jingyan.baidu.com/article/ed15cb1b5c67781be3698121.html

如果有朋友能将缺失的数据补上或者指正错误的数据,可以根据需要双方交换所需数据(还有许多未上传数据),共同进步。

各指标及汇总数据如下:

网盘下载全部数据.txt (147 Bytes, 需要: RMB 98 元)

汇总2000到2018年省级整理面板数据.xlsx (815.07 KB, 需要: RMB 80 元)

汇总2000到2018省级原始数据.xlsx (191.26 KB, 需要: RMB 64 元)

2000到2018省级网络普及率.xlsx (38.75 KB, 需要: RMB 8 元)

2000到2018省级市场化进程.xlsx (63 KB, 需要: RMB 8 元)

2000到2018省级人均受教育年限.xlsx (72.67 KB, 需要: RMB 8 元)

2000到2018省级能源消耗.xlsx (45.61 KB, 需要: RMB 8 元)

2000到2018省级技术市场成交额.xlsx (93.03 KB, 需要: RMB 8 元)

2000到2018省级固定资产投入.xlsx (141.77 KB, 需要: RMB 8 元)

2000到2018省级城镇化率数据.xlsx (36.71 KB, 需要: RMB 8 元)

2000到2018省级城乡收入差距.xlsx (55.88 KB, 需要: RMB 8 元)

2000到2018省级1到3产就业人数.xlsx (68.94 KB, 需要: RMB 8 元)

2000到2018年省级实际GDP.xlsx (55.21 KB, 需要: RMB 8 元)

2000到2018年省级进出口总额数据.xlsx (85.88 KB, 需要: RMB 8 元)

2000到2018年省级货物总周转量.xlsx (73.63 KB, 需要: RMB 8 元)

2000到2018财政支出数据.xlsx (49.5 KB, 需要: RMB 8 元)

2000到2018PM2.5数据.xlsx (63.05 KB, 需要: RMB 8 元)



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


专利授权量数据.jpg (132.75 KB)

专利授权量数据.jpg

欢迎关注公众号:美目流连

沙发
Sweet.果儿(真实交易用户) 发表于 2020-3-22 17:16:09
你好,我想购买你的数据,请问数据来源是什么呢?网络普及率、人均受教育年限、城乡收入差距这几个

藤椅
Sweet.果儿(真实交易用户) 发表于 2020-3-22 17:18:06
你好,我想购买你的数据,请问数据来源是什么呢?网络普及率、人均受教育年限、城乡收入差距这几个

板凳
king.ming(未真实交易用户) 在职认证  发表于 2020-3-22 19:28:01
Sweet.果儿 发表于 2020-3-22 17:18
你好,我想购买你的数据,请问数据来源是什么呢?网络普及率、人均受教育年限、城乡收入差距这几个
网络普及率数据来源于互联网信息中心,人均受教育年限数据来源于统计年鉴,城乡收入差距数据来源于中国经济与社会发展统计数据库及各省市区经济与社会发展公报

报纸
binyi3121(未真实交易用户) 发表于 2020-3-27 11:55:55
您好,我想知道您城乡收入差距的计算方法。
因为我自己查找资料的时候是城镇的数据是“城镇居民人均可支配收入”,但农村是“农民人均纯收入”。因为这二者的意义不一样,所以想请教一下您数据的计算方式。

地板
king.ming(未真实交易用户) 在职认证  发表于 2020-3-28 21:51:32
binyi3121 发表于 2020-3-27 11:55
您好,我想知道您城乡收入差距的计算方法。
因为我自己查找资料的时候是城镇的数据是“城镇居民人均可支配 ...
计算方法:城镇居民人均可支配收入/农村居民人均可支配收入,在城乡收入差距表里有三组数据,分别为城镇居民收入、农村居民收入,和收入差距比,你可以在表里看到很详细的从1999到2016的三组计算数据,2017和2018只有收入比数据,希望能对你有帮助

7
JASONKKUANG(未真实交易用户) 在职认证  学生认证  发表于 2020-4-8 08:50:20
16个省市做计量分析有点少啊,要是能够扩展到30或者31个省市就比较好!

8
king.ming(未真实交易用户) 在职认证  发表于 2020-4-8 22:32:09 来自手机
JASONKKUANG 发表于 2020-4-8 08:50
16个省市做计量分析有点少啊,要是能够扩展到30或者31个省市就比较好!
不含港澳台,包含全部的省级及直辖市的面板数据

9
王晶晶是大笨蛋(未真实交易用户) 在职认证  发表于 2020-5-27 09:47:06
固定资产投入是流量数据还是存量数据呢

10
sunchuntao(未真实交易用户) 发表于 2021-4-3 09:58:40
进出口数据是按照目的地还是公司注册地?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-12 08:28