数据指标:行政区划代码 地区 长江经济带 经度 纬度 年份 建筑业总产值(亿元) 内资企业建筑业总产值(亿元) 国有建筑业总产值(亿元) 集体建筑业总产值(亿元) 港澳台商投资企业建筑业总产值(亿元) 港澳台商独资企业建筑业总产值(亿元) 外商投资企业建筑业总产值(亿元) 外商独资企业建筑业总产值(亿元) 建筑业总产值(亿元) 房屋和土木工程建筑业建筑业总产值(亿元) 房屋工程建筑建筑业总产值(亿元) 土木工程建筑建筑业总产值(亿元) 建筑安装业建筑业总产值(亿元) 建筑装饰业建筑业总产值(亿元) 其他建筑业建筑业总产值(亿元)
数据年度:2000-2021,时间跨度22年。来源于中国统计年鉴、各省统计年鉴2001-2022数据
excel数据文件包原始数据-宽面板(由于多年度指标不同存在缺失值)、线性插值、ARIMA填补三个版本,提供您参考使用。
其中,ARIMA填补无缺失值。
各个版本的全国31个省份(自治区、直辖市)、22个年度各指标的数据在一张excel表上!
本数据为中国统计年鉴、各省统计年鉴2001-2022面板数据,因为数据年度=统计年鉴年度-1,所以为数据年度是2000-2021年各个省级的统计数据。
数据主要来源于中国统计年鉴、各省统计年鉴多年度数据整理,经数据处理软件与相关代码分析得来。
填补说明:
线性插值。利用数据的线性趋势,对各年份中间的缺失部分进行填充,得到线性插值版数据,这也是学者最常用的插值方式。
ARIMA填补。基于ARIMA模型,利用同一地区的时间序列数据,对缺失值进行预测填补。
注:由于该方法填补数据较多,不能完全反应地区真实情况,谨慎使用。
各个版本的数据格式大致如下(以下图片内容只是示例,不是本贴子指标数据内容,它可以说明本贴子所包含的指标在不同版本的数据情况):
1、原始数据-寛面板:指标在每一列上(2000-2021年度在行上),由于多年度指标不同、各个指标会存在缺失值:
2、线性插值:指标在每一列上(2000-2021年度在行上),各个指标存在缺失值:
3、ARIMA填补无缺失值:指标在每一列上(2000-2021年度在行上),各个指标的数据完整,不存在缺失值:
也就是,该版本所有指标数据都是完整无缺失的