楼主: ___Xmmy
355 0

[面板数据求助] stata代码等距扩充成企业-年份-行业(id-year-ind)的面板数据 [推广有奖]

  • 5关注
  • 0粉丝

硕士生

69%

还不是VIP/贵宾

-

威望
0
论坛币
621 个
通用积分
0.0266
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
253 点
帖子
26
精华
0
在线时间
352 小时
注册时间
2012-9-12
最后登录
2024-9-12

50论坛币
CSMAR数据库-上市公司基本信息年度表-有企业-年度-行业的面板数据,但是数据起始时间是2000-2022,刚好我研究的数据是1991年开始的,需要手动填充1991-1999年的企业代码。CNRDS数据库有id-industry的企业-行业面板数据,但是是不准确的,因为同一家企业由于经营时间的变动,可能会更换主营业务导致改变了其行业类型,因此我下面的面板数据就是很严谨和准确的,但是需要按照年份等距填充一下,代码我能不够向各位老师求助。
于是下载了如下的企业(id)-实施开始年份(year1)-行业代码(industrycode)-行业名称(industryname)的数据如下。想要达到的效果是:
(1)形成一个id-year-year1-industrycode-industryname的面板数据,id=1的企业从year=1991,1992,1993……一直到2022年,多了一列year(1991-2022)的变量;
(2)拿id=4的企业来说,它分别在1991,2010,2020三个年份更换企业4的行业代码,那么year从1991-2009,2010-2020,2021-2022这几段年度区间企业4的行业代码-行业名称(industrycode-industryname)就应该分别为G54,C27,I65。具体企业4的填充后的效果如第二张图片;
(3)还有一个问题是,有的企业id它同一年份会有两个不同的行业代码-行业名称(industrycode-industryname),此时取最先出现的那个行业(这个小误差无法避免)。


----------------------- copy starting from the next line -----------------------
  • * Example generated by -dataex-. For more info, type help dataex
  • clear
  • input long id float year1 str12 industrycode str60 industryname
  • 1 1991 "J66" "货币金融服务"
  • 2 1991 "K70" "房地产业"
  • 3 1991 "S90" "综合"
  • 4 1991 "G54" "道路运输业"
  • 4 2010 "C27" "医药制造业"
  • 4 2020 "I65" "软件和信息技术服务业"
  • 5 1990 "S90" "综合"
  • 5 2012 "K70" "房地产业"
  • 5 2016 "N77" "生态保护和环境治理业"
  • 6 1992 "K70" "房地产业"
  • 7 1992 "K70" "房地产业"
  • 7 2010 "H61" "住宿业"
  • 7 2017 "K70" "房地产业"
  • 8 1992 "I64" "互联网和相关服务"
  • 8 2010 "F51" "批发业"
  • 8 2012 "H61" "住宿业"
  • 8 2015 "C37" "铁路、船舶、航空航天和其它运输设备制造业"
  • 9 1991 "S90" "综合"
  • end

[color=rgb(51, 102, 153) !important]复制代码


------------------ copy up to and including the previous line ------------------

11111.png (72.5 KB)

11111.png

22222.png (173.79 KB)

22222.png

关键词:Stata year 面板数据 tata IND stata 代码 编辑
您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 08:02