全国2708个县域区县人口年末人口户籍乡村人口数2000-2023年(插值无缺版
一、数据背景
本数据基于《中国区域经济统计年鉴》《中国县域统计年鉴》等官方资料,系统整合了2000-2023年县级行政单位的经济、人口、农业、教育、卫生、投资、能源等80项指标。为确保数据连续性与可用性,采用线性插值与ARIMA模型进行缺失值填补,转化为完整的平衡面板数据,同时保留原始数据版本,满足不同研究需求。
二、数据概况
数据名称:县域经济人口农业财政投资社会发展综合数据库
数据范围:全国2708个区县(县域/撤县市设立的区,不含主城区)
时间范围:2000-2023年
数据来源:《中国区域经济统计年鉴》《中国县域统计年鉴》
数据版本:原始版、线性插值版、ARIMA填补版
整理方式:NLP识别+单位统一+地区统一+人工验证+平衡面板处理
全国2708个县域区县人口年末人口户籍乡村人口数2000-2023年(插值无缺版).xlsx
(7.23 MB, 需要: RMB 33 元)
三、数据指标
年份 |
省份 |
城市 |
区县 |
区县代码 |
年末总人口_万人 |
乡村人口_万人 |
户籍人口数_万人 |
四、整理与填补方法
年鉴识别与面板转化
基于NLP算法自动识别《中国区域经济统计年鉴》《中国县域统计年鉴》表格数据,转化为标准化面板格式。
数据完善与核验
对比主流数据库及地方统计局数据,对异常或缺失数据进行补充与修正,统一地区代码(2019版民政部标准),统一单位。
人工抽样验证
在算法处理基础上,人工抽样核验部分数据,确保数据准确性和一致性。
平衡面板构建
剔除缺失严重的县区样本,确保每个县区在2000-2023年期间均有完整数据记录。
缺失值填补处理
线性插值版:对年份中间的零散缺失值采用线性趋势插补。
ARIMA填补版:对剩余缺失值基于时间序列趋势预测填补,提高数据连续性和合理性。
原始版:保留未填补前的原始数据,供自定义处理。
最终形成原始版、线性插值版、ARIMA填补版三套数据,供不同研究需求灵活选择。
五、部分数据展示


雷达卡




京公网安备 11010802022788号







