数据指标:行政区划代码 地区 长江经济带 经度 纬度 年份 企业数(个) 期末使用计算机数(台) 每百人使用计算机数(台) 企业拥有网站数(个) 每百家企业拥有网站数(个) 有电子商务交易活动的企业数(个) 有电子商务交易活动的企业数比重(%) 电子商务销售额(亿元) 电子商务采购额(亿元) 软件业务收入(万元) 软件产品收入(万元) 信息技术服务收入(万元) 信息安全收入(万元) 嵌入式系统软件收入(万元) 软件业务出口(万美元)
全国31个省份信息安全软件业务产品出口收入电子商务销售额采购额2000-2021含无缺失值填补.xlsx
(430.29 KB, 需要: RMB 69 元)
数据年度:2000-2021,时间跨度22年。来源于中国统计年鉴、各省统计年鉴2001-2022数据
excel数据文件包原始数据-宽面板(由于多年度指标不同存在缺失值)、线性插值、ARIMA填补三个版本,提供您参考使用。
其中,ARIMA填补无缺失值。
各个版本的全国31个省份(自治区、直辖市)、22个年度各指标的数据在一张excel表上!
本数据为中国统计年鉴、各省统计年鉴2001-2022面板数据,因为数据年度=统计年鉴年度-1,所以为数据年度是2000-2021年各个省级的统计数据。
数据主要来源于中国统计年鉴、各省统计年鉴多年度数据整理,经数据处理软件与相关代码分析得来。
填补说明:
线性插值。利用数据的线性趋势,对各年份中间的缺失部分进行填充,得到线性插值版数据,这也是学者最常用的插值方式。
ARIMA填补。基于ARIMA模型,利用同一地区的时间序列数据,对缺失值进行预测填补。
注:由于该方法填补数据较多,不能完全反应地区真实情况,谨慎使用。
各个版本的数据格式大致如下(以下图片内容只是示例,不是本贴子指标数据内容,它可以说明本贴子所包含的指标在不同版本的数据情况):
1、原始数据-寛面板:指标在每一列上(2000-2021年度在行上),由于多年度指标不同、各个指标会存在缺失值:

2、线性插值:指标在每一列上(2000-2021年度在行上),各个指标存在缺失值:

3、ARIMA填补无缺失值:指标在每一列上(2000-2021年度在行上),各个指标的数据完整,不存在缺失值:

也就是,该版本所有指标数据都是完整无缺失的


雷达卡





京公网安备 11010802022788号







