一、数据介绍
数据名称:2022-1990全国300城市地级市数据库Excel城市统计年鉴189指标面板数据(插值填补无缺失版)
数据年份:1990-2022年
更新范围:全国300个地级市、城市(含直辖市)
数据来源:《中国城市统计年鉴》、地方统计局
数据格式:Excel面板数据含原始数据(由于多年度指标不同存在缺失值)、线性插值、回归填补(无缺失)三个版本,提供您参考使用。其中,回归填补无缺失值。
二、整理方法
第一,识别年鉴。利用NLP算法识别《中国城市统计年鉴》,并转为面板数据
第二,完善数据。对比主流数据库、地方统计局,进一步完善城市数据
第三,统一地区。匹配民政部编码,统一使用2019年编码和地区名称
第四,统一单位。对不同单位的情况,进行单位换算
第五,匹配位置。利用高德地图API,得到地区的经纬度
第六,人工验证。得到所有指标的面板数据,并人工抽样验证
第七,平衡面板。将非平衡面板转为平衡面板数据
第八,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版
第九,ARIMA填补。利用时间趋势,对剩余缺失进行预测,得到ARIMA填补版
最终,保留原始版本、线性插值版、ARIMA填补版
三、数据指标
共计189个指标,部分如下:
年份 | 行政区划代码 | 地区 |
地区生产总值 | 第一产业增加值 | 第二产业增加值 |
第三产业增加值 | 第一产业增加值占GDP比重 | 第二产业增加值占GDP比重 |
第三产业增加值占GDP比重 | 人均地区生产总值 | 户籍人口 |
城镇户籍人口 | 非农业人口数 | 年平均人口 |
年末总户数 | 出生人口 | 死亡人口 |
自然增长率 | 常住人口 | 城镇常住人口 |
年末单位从业人员数 | 城镇私营和个体从业人员数 | 年末城镇登记失业人员数 |
第一产业从业人员数 | 第二产业从业人员数 | 第三产业从业人员数 |
第一产业从业人员比重 | 第二产业从业人员比重 | 第三产业从业人员比重 |
农林牧渔业从业人员数 | 采掘业从业人员数 | 制造业从业人员数 |
电力煤气及水生产供应业从业人员数 | 建筑业从业人员数 | 交通仓储邮电业从业人员数 |
信息传输、计算机服务和软件业从业人员数 | 批发零售贸易业从业人员数 | 住宿餐饮业从业人员数 |
金融业从业人员数 | 房地产业从业人员数 | 租赁和商业服务业从业人员数 |
科研、技术服务和地质勘查业从业人员数 | 水利、环境和公共设施管理业从业人员数 | 居民服务和其他服务业从业人员数 |
教育业从业人员数 | 卫生、社会保险和社会福利业从业人员数 | 文化、体育和娱乐业从业人员数 |
公共管理和社会组织从业人员数 | 地质勘察水利管理业从业人数 | 交通仓储邮电通信业从业人员数 |
批发零售贸易餐饮业从业人员数 | 社会服务业从业人员数 | 卫生体育社会福利业从业人员数 |
教育文艺广播影视业从业人员数 | 科研综合技术服务业从业人员数 | 机关和社会团体从业人员数 |
在岗职工平均人数 | 在岗职工工资总额 | 职工平均工资 |
行政区域土地面积 | 年末耕地总资源 | 人均占有耕地面积 |
人口密度 | 水资源总量 | 地区生产总值增长率 |
粮食产量 | 油料产量 | 棉花产量 |
蔬菜产量 | 水果产量 | 肉类产量 |
奶类产量 | 水产品产量 | 禽蛋产量 |
.... | .... | ..... |
四、数据Excel数据展示: