楼主: 白羽向
2427 6

[数据管理求助] 三个年度数据按共同企业取交集合并 [推广有奖]

  • 0关注
  • 0粉丝

初中生

0%

还不是VIP/贵宾

-

威望
0
论坛币
797 个
通用积分
1.0471
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
586 点
帖子
15
精华
0
在线时间
0 小时
注册时间
2014-12-1
最后登录
2016-11-25

楼主
白羽向 学生认证  发表于 2015-11-4 17:41:06 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有05,06,07三年的分析师对上市公司盈利预测样本,每一个样本包括上市公司、分析师、盈利预测、上市公司年报数据blabla很多变量。
因为想研究05,06,07三年间发生事件的对盈利预测的影响,需要排除掉三年中新进入以及退出企业的影响,因此要取三年企业的交集。
譬如05年有ABCDEFG企业;06年进入HIJK企业,FG企业退出;07年进入LMN企业,DE企业退出,则三年都有的企业是ABC。
因为样本取的是企业的盈利预测,每个企业可能不只一条预测结果,上市公司号这个变量并不唯一。
想问有没有合适的处理方法。
表达上不知道还有没有什么问题?请教各位大大!
PS:一个信管的同学用R帮我做出来一次了,但是因为数据是dta格式的,通过EXCEL中转变量的类型好多都变了,所以还是来问问各位高手,有没有什么办法能够在stata里就实现这种合并的。

在此多谢大家,祝论文顺利![loveliness]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:年度数据 ABCDEFG 上市公司年报 Stata Lines 上市公司 ABCDEFG 分析师

沙发
hustchen2012 在职认证  发表于 2015-11-5 08:08:28
数据库都有上市公司上市年份,如果上市年份晚于2005年,删除这些企业样本。
再创造一个变量,比如
  1. gen x=1
  2. bys stkcd : egen y=sum(x)
  3. drop if  y<3
复制代码

藤椅
白羽向 学生认证  发表于 2015-11-5 17:09:27 来自手机
hustchen2012 发表于 2015-11-5 08:08
数据库都有上市公司上市年份,如果上市年份晚于2005年,删除这些企业样本。
再创造一个变量,比如
感谢提供思路!
如果还要考虑分析师预测呢,比如有的企业三年都在市场里,但是中间有一年没有预测样本。

板凳
hustchen2012 在职认证  发表于 2015-11-5 17:50:30
白羽向 发表于 2015-11-5 17:09
感谢提供思路!
如果还要考虑分析师预测呢,比如有的企业三年都在市场里,但是中间有一年没有预测样本。
先drop if analyst_forcast==.
在做上面的处理

报纸
白羽向 学生认证  发表于 2015-11-5 18:24:16 来自手机
hustchen2012 发表于 2015-11-5 17:50
先drop if analyst_forcast==.
在做上面的处理
出现在数据里的样本forecast都存在,但是有的公司部分年份没有预测的没有出现在当年数据中,比如06年,但0507有

地板
hustchen2012 在职认证  发表于 2015-11-5 20:07:39
白羽向 发表于 2015-11-5 18:24
出现在数据里的样本forecast都存在,但是有的公司部分年份没有预测的没有出现在当年数据中,比如06年,但 ...
那就删除06年的,然后通过识别刚开始的那个程序识别是不是三年的数据。这个缺少了06年的样本y就不等于3了,肯定会被删除了

7
白羽向 学生认证  发表于 2015-11-7 11:58:04 来自手机
hustchen2012 发表于 2015-11-5 20:07
那就删除06年的,然后通过识别刚开始的那个程序识别是不是三年的数据。这个缺少了06年的样本y就不等于3了 ...
年份多是不是要一年一年操作?
灰常感谢这么热心回答我这么小白的连环问!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 19:12