于是下载了如下的企业(id)-实施开始年份(year1)-行业代码(industrycode)-行业名称(industryname)的数据如下。想要达到的效果是:
(1)形成一个id-year-year1-industrycode-industryname的面板数据,id=1的企业从year=1991,1992,1993……一直到2022年,多了一列year(1991-2022)的变量;
(2)拿id=4的企业来说,它分别在1991,2010,2020三个年份更换企业4的行业代码,那么year从1991-2009,2010-2020,2021-2022这几段年度区间企业4的行业代码-行业名称(industrycode-industryname)就应该分别为G54,C27,I65。具体企业4的填充后的效果如第二张图片;
(3)还有一个问题是,有的企业id它同一年份会有两个不同的行业代码-行业名称(industrycode-industryname),此时取最先出现的那个行业(这个小误差无法避免)。
----------------------- copy starting from the next line -----------------------
- * Example generated by -dataex-. For more info, type help dataex
- clear
- input long id float year1 str12 industrycode str60 industryname
- 1 1991 "J66" "货币金融服务"
- 2 1991 "K70" "房地产业"
- 3 1991 "S90" "综合"
- 4 1991 "G54" "道路运输业"
- 4 2010 "C27" "医药制造业"
- 4 2020 "I65" "软件和信息技术服务业"
- 5 1990 "S90" "综合"
- 5 2012 "K70" "房地产业"
- 5 2016 "N77" "生态保护和环境治理业"
- 6 1992 "K70" "房地产业"
- 7 1992 "K70" "房地产业"
- 7 2010 "H61" "住宿业"
- 7 2017 "K70" "房地产业"
- 8 1992 "I64" "互联网和相关服务"
- 8 2010 "F51" "批发业"
- 8 2012 "H61" "住宿业"
- 8 2015 "C37" "铁路、船舶、航空航天和其它运输设备制造业"
- 9 1991 "S90" "综合"
- end
------------------ copy up to and including the previous line ------------------


雷达卡







京公网安备 11010802022788号







