数据包括了1994-2019年314个地级市的面板数据,170+个指标。提供了三个表格,分别是原始数据、线性插值、热卡填充,后面两个是对确实数据的填补。
线性插值。利用数据的线性趋势,对各年份中间的缺失部分进行填充,得到线性插值版数据,这也是学者最为常用的插值方式。
注:如果填补较多或者变量单位是整数,那么填补就会失真。如果填补后出现负值,而实际情况没有负值的情况,则谨慎使用。
热卡填补。寻找同地区的往年最相似对象的变量数据,对缺失进行填充,得到热卡填补版。
注:由于该方法填补数据较多,且不能反应数据增长趋势,谨慎使用。