数据范围:1990-2018年,包括307个地级市
整理方式如下:
第一,识别年鉴。利用NLP算法识别《中国城市统计年鉴》,并转为面板数据
第二,完善数据。对比主流数据库、地方统计局,进一步完善城市数据
第三,统一编码。匹配民政部地区编码(统一使用2018年编码)
第四,统一名称。统一使用城市名称(由于不同年份,统一使用2018年的民政部公开的地区名称)
第五,统一单位。对不同单位的情况,进行单位换算
第六,匹配位置。利用高德地图API,得到地区的经纬度
第七,人工验证。得到所有指标的面板数据,并人工抽样验证