由于unbalanced.1998--2007.dta已经做出了结果,但这个数据文件并不是以时间和样本代码为分类依据的传统的面板数据,因此需要进行格式调整,以用于以后的经济分析。编的程序如下:
*生成面板识别码:
clear
use "C:\Users\dell-pc\Desktop\工业企业数据库-处理结果\", clear
gen penal_id=_n
*提取每年的样本数:
forvalues i = 1998/2007{
use "C:\Users\dell-pc\Desktop\工业企业数据库-处理结果\BRANDT匹配方法结果.dta", clear
keep penal_id *`i'
rename *`i' *
drop if name=="" & legal_person=="" & product1_=="" & zip=="" & cic=="" & dq=="" & revenue==.
saveold ididid`i'.dta,replace
}
*将各年样本合并成面板数据:
use ididid1998.dta,clear
append using ididid1999.dta,force
append using ididid2000.dta,force
append using ididid2001.dta,force
append using ididid2002.dta,force
append using ididid2003.dta,force
append using ididid2004.dta,force
append using ididid2005.dta,force
append using ididid2006.dta,force
append using ididid2007.dta,force
*最终生成可用的面板数据文件perfect_panel_98_07.dta:
saveold perfect_panel_98_07.dta,replace
这样最终的面板格式的数据文件生成,可以做经济分析了。