分省份的地级市、县级市的城市建设统计面板2002-2022数据
数据含省份、行政区划级别(细分分省级、地级市、县级市)两个变量,便于多个角度的筛选与应用
数据来源于中国城市建设数据库,是根据历年《中国城市建设统计年鉴》数据整理。包括城市人口、建设、财政、投资、供水、节水、燃气、供热、交通、环境、卫生、绿化等13个部分
中国城市建设数据库覆盖范围包括全国693个城市。共计333个指标。内含原始数据、线性插值、回归填补版本,当前更新至2022年
数据来源:基于《中国城市建设统计年鉴》2002-2022多年度版本的数据整理
数据范围:2002-2022年,含各个省的省级统计、地级市、县级市
样本数量:333个指标
更新时间:2023年
二、整理方法:
第一,识别年鉴。利用NLP算法识别《中国城市建设统计年鉴》,并转为面板数据
第二,统一地区。匹配民政部编码,统一使用2019年编码和地区名称
第三,统一单位。对不同单位的情况,进行单位换算
第四,人工验证。得到所有指标的面板数据,并人工抽样验证
第五,线性插值。利用线性趋势对中间缺失进行填充,得到线性插值版
第六,回归填补。利用时间趋势,对剩余缺失进行预测,得到回归填补版
excel数据文件包原始数据(由于多年度指标不同存在缺失值)、线性插值、回归填补三个版本,提供您参考使用。
其中,回归填补无缺失值。
填补说明:
线性插值。利用数据的线性趋势,对各年份中间的缺失部分进行填充,得到线性插值版数据,这也是学者最常用的插值方式。
回归填补。基于ARIMA模型,利用同一地区的时间序列数据,对缺失值进行预测填补。
每个省及其具体的每个地级市、县级市的数据大致如下:
包含的指标有333个:
指标
省份
行政区划代码
年份
地区
行政区划级别
人口密度_人/平方公里
人均日生活用水量_升
用水普及率_百分比
燃气普及率_百分比
建成区供水管道密度_公里/平方公里
人均道路面积_平方米
建成区排水管道密度_公里/平方公里
污水处理率_百分比
污水处理厂集中处理率_百分比
人均公园绿地面积_平方米
建成区绿化覆盖率_百分比
建成区绿地率_百分比
生活垃圾处理率_百分比
生活垃圾无害化处理率_百分比
市区面积_平方公里
....
运营车数_辆
运营车数-地铁运营车数_辆
运营车数-轻轨运营车数_辆
运营车数-有轨电车运营车数_辆
标准运营车数_标台
运营线路网长度_公里
运营线路长度_公里
运营线路长度-地铁运营线路长度_公里
运营线路长度-轻轨运营线路长度_公里
运营线路长度-有轨电车运营线路长度_公里
客运总量_万人次
城市轨道交通在建-线路长度_公里
....
城市市容环境卫生-生活垃圾-无害化处理量_万吨
城市市容环境卫生-生活垃圾-无害化处理量-生活垃圾卫生填埋场处理量_万吨
城市市容环境卫生-生活垃圾-无害化处理量-生活垃圾堆肥厂处理量_万吨
城市市容环境卫生-生活垃圾-无害化处理量-生活垃圾焚烧厂处理量_万吨
城市市容环境卫生-粪便清运量_万吨
城市市容环境卫生-粪便处理量_万吨
城市市容环境卫生-公厕数_座
城市市容环境卫生-公厕数-三类以上公厕数_座
城市市容环境卫生-市容环卫专用车辆设备总数_台