- 阅读权限
- 255
- 威望
- 0 级
- 论坛币
- 621 个
- 通用积分
- 0.0266
- 学术水平
- 0 点
- 热心指数
- 0 点
- 信用等级
- 0 点
- 经验
- 253 点
- 帖子
- 26
- 精华
- 0
- 在线时间
- 352 小时
- 注册时间
- 2012-9-12
- 最后登录
- 2024-9-12
硕士生
还不是VIP/贵宾
- 威望
- 0 级
- 论坛币
- 621 个
- 通用积分
- 0.0266
- 学术水平
- 0 点
- 热心指数
- 0 点
- 信用等级
- 0 点
- 经验
- 253 点
- 帖子
- 26
- 精华
- 0
- 在线时间
- 352 小时
- 注册时间
- 2012-9-12
- 最后登录
- 2024-9-12
|
50论坛币
CSMAR数据库-上市公司基本信息年度表-有企业-年度-行业的面板数据,但是数据起始时间是2000-2022,刚好我研究的数据是1991年开始的,需要手动填充1991-1999年的企业代码。CNRDS数据库有id-industry的企业-行业面板数据,但是是不准确的,因为同一家企业由于经营时间的变动,可能会更换主营业务导致改变了其行业类型,因此我下面的面板数据就是很严谨和准确的,但是需要按照年份等距填充一下,代码我能不够向各位老师求助。
于是下载了如下的企业(id)-实施开始年份(year1)-行业代码(industrycode)-行业名称(industryname)的数据如下。想要达到的效果是:
(1)形成一个id-year-year1-industrycode-industryname的面板数据,id=1的企业从year=1991,1992,1993……一直到2022年,多了一列year(1991-2022)的变量;
(2)拿id=4的企业来说,它分别在1991,2010,2020三个年份更换企业4的行业代码,那么year从1991-2009,2010-2020,2021-2022这几段年度区间企业4的行业代码-行业名称(industrycode-industryname)就应该分别为G54,C27,I65。具体企业4的填充后的效果如第二张图片;
(3)还有一个问题是,有的企业id它同一年份会有两个不同的行业代码-行业名称(industrycode-industryname),此时取最先出现的那个行业(这个小误差无法避免)。
----------------------- copy starting from the next line -----------------------
- * Example generated by -dataex-. For more info, type help dataex
- clear
- input long id float year1 str12 industrycode str60 industryname
- 1 1991 "J66" "货币金融服务"
- 2 1991 "K70" "房地产业"
- 3 1991 "S90" "综合"
- 4 1991 "G54" "道路运输业"
- 4 2010 "C27" "医药制造业"
- 4 2020 "I65" "软件和信息技术服务业"
- 5 1990 "S90" "综合"
- 5 2012 "K70" "房地产业"
- 5 2016 "N77" "生态保护和环境治理业"
- 6 1992 "K70" "房地产业"
- 7 1992 "K70" "房地产业"
- 7 2010 "H61" "住宿业"
- 7 2017 "K70" "房地产业"
- 8 1992 "I64" "互联网和相关服务"
- 8 2010 "F51" "批发业"
- 8 2012 "H61" "住宿业"
- 8 2015 "C37" "铁路、船舶、航空航天和其它运输设备制造业"
- 9 1991 "S90" "综合"
- end
[color=rgb(51, 102, 153) !important]复制代码
------------------ copy up to and including the previous line ------------------
|
|