楼主: wingguy
7146 17

[编程问题求助] 面板数据筛选问题,挺急的,在线等…… [推广有奖]

  • 1关注
  • 0粉丝

等待验证会员

高中生

80%

还不是VIP/贵宾

-

威望
0
论坛币
56 个
通用积分
0.4362
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
417 点
帖子
11
精华
0
在线时间
60 小时
注册时间
2012-11-4
最后登录
2020-5-11

楼主
wingguy 学生认证  发表于 2014-6-5 21:04:32 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
目前,小弟我有一个面板数据,上市公司从03年到12年股票的月收益率,由于本身并不是平衡面板数据,但是直接调用连玉君老师的xtbalance命令的话会造成数据量损失巨大。目前我希望的筛选条件定为:任意一公司,只要从03年到12年之间,其中一整年之内的连续12个月的观测值都缺失的话,就把这个公司所有观测值drop掉。
本人思前想后,想到头都爆炸了还是想不到实现方法,请各位大牛指教指教,说说思路都可以。
PS:某些股票一整年的观测值确实有可能是因为,财务问题导致停牌,停牌时长1年到3年的都有。
谢谢啊~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据筛选 面板数据 在线等 xtbalance balance 上市公司 收益率 在线

回帖推荐

réussite 发表于2楼  查看完整内容

没明白,如果只是想drop obs的话,if不就好了,各月观测值等于0,用&连一起,然后把各年的都写了,删完了之后不就是你想要的了?如果嫌麻烦就用loop。 不过不推荐用drop,还是新建一个新的dta,万一错了还能改。
gg

沙发
réussite 发表于 2014-6-5 23:06:55
没明白,如果只是想drop obs的话,if不就好了,各月观测值等于0,用&连一起,然后把各年的都写了,删完了之后不就是你想要的了?如果嫌麻烦就用loop。

不过不推荐用drop,还是新建一个新的dta,万一错了还能改。
已有 1 人评分经验 论坛币 学术水平 热心指数 收起 理由
crystal8832 + 10 + 10 + 1 + 1 鼓励积极发帖讨论

总评分: 经验 + 10  论坛币 + 10  学术水平 + 1  热心指数 + 1   查看全部评分

藤椅
wingguy 学生认证  发表于 2014-6-5 23:35:28
réussite 发表于 2014-6-5 23:06
没明白,如果只是想drop obs的话,if不就好了,各月观测值等于0,用&连一起,然后把各年的都写了,删完了之 ...
可能我没把问题说清楚,我是想把其中有一年的是没有观测值的公司给drop掉,至于没有观测值,并不是说那个公司的收益率为空缺,而是这个公司在某一年都没有观测值(不仅仅是收益率空缺),我想编程识别出这些公司。譬如一个公司3年以内应该有36个obs(月度数据),但是由于停牌两年,结果只有12个obs。
其实我就是想把这些公司都找出来,然后drop掉。
gg

板凳
réussite 发表于 2014-6-5 23:53:14
wingguy 发表于 2014-6-5 23:35
可能我没把问题说清楚,我是想把其中有一年的是没有观测值的公司给drop掉,至于没有观测值,并不是说那个 ...
Ok,还是没明白。如果您的月度数据已经按年月命名的话,应该会容易些。

gen missing=0
replace missing=1 if 0301==0 & 0302==0 & 0303==0 & 0304==0 & 0305==0 & 0306==0 & 0307==0 & 0308==0 & 0309==0 & 0310==0 & 0311==0 & 0312==0
replace missing =1 if 把03改成04,剩下copy
……如此,做各年

drop if missing==1
各年的都木有鸟

或者用loop,不用辣么多字,但要求您的变量名比较统一

已有 1 人评分经验 热心指数 收起 理由
crystal8832 + 10 + 1 补偿

总评分: 经验 + 10  热心指数 + 1   查看全部评分

报纸
wingguy 学生认证  发表于 2014-6-5 23:53:29
réussite 发表于 2014-6-5 23:06
没明白,如果只是想drop obs的话,if不就好了,各月观测值等于0,用&连一起,然后把各年的都写了,删完了之 ...
我现在有个想法,不过卡住了,思路是:
forvalue每一个公司(大概有1000家),然后生成关于年份的虚拟变量,正常来说只要不是停牌超过一年的公司,在03年到12年期间应该是会生成10个虚拟变量,如果少于10的话就代表中间有至少一年停牌,那么我就直接在面板数据里面drop掉这家公司。
但是,我在怎么数生成了多少个虚拟变量上卡住了,不知道怎么写程序。
gg

地板
réussite 发表于 2014-6-5 23:57:21
wingguy 发表于 2014-6-5 23:53
我现在有个想法,不过卡住了,思路是:
forvalue每一个公司(大概有1000家),然后生成关于年份的虚拟变 ...
用loop生成missing=1,一年都木有就是12,然后各年求sum,=12就生成当年missing——year=1,然后drop if missing_year==1。好吧,很麻烦,就是一点点建议,您慢慢想

7
réussite 发表于 2014-6-6 00:01:43
wingguy 发表于 2014-6-5 23:53
我现在有个想法,不过卡住了,思路是:
forvalue每一个公司(大概有1000家),然后生成关于年份的虚拟变 ...
forvalues i=1/9 {
gen tmonth`i'=0
replace tmonth`i'=1 if 030`i'==.
}

加10,11,12月的
gen tyear=0
forvalues i=1/9 {
replace tyear=tyear+1 if tmonth`i'==1
}

加10,11,12月的

drop if tyear==12
只是个思路,可能不大对,得改。

8
wingguy 学生认证  发表于 2014-6-6 00:11:40
réussite 发表于 2014-6-6 00:01
forvalues i=1/9 {
gen tmonth`i'=0
replace tmonth`i'=1 if 030`i'==.
谢谢你帮忙啊,我看完了你的程序,也看懂了。
但是估计问题还是在我,我没有说清楚我的问题,其实我遇到的问题是如下图所示,对于这个stock code是38的公司来说它在08~12年都是没有数据的,相当于这个公司从07年直接跳跃到13年了。我的目的就是要把这些公司找出来,然后drop掉。
正如你的编程所写的,我用两个嵌套循环去找这些公司,第一层循环是每一个公司,第二层循环是每一年(03到12年)。但是如果其中有一年或以上是没有观测值,如下图,循环是会断开的。譬如下图,循环跑到07年以后就会断开,因为没有08年。

QQ截图20140606000718.png


gg

9
réussite 发表于 2014-6-6 00:24:11
wingguy 发表于 2014-6-6 00:11
谢谢你帮忙啊,我看完了你的程序,也看懂了。
但是估计问题还是在我,我没有说清楚我的问题,其实我遇到 ...
第二行的变量值是文本么?我建议生成time trend,不管是做panel也好,按年月生成变量也好,都方便些。

10
wingguy 学生认证  发表于 2014-6-6 00:28:18
réussite 发表于 2014-6-6 00:24
第二行的变量值是文本么?我建议生成time trend,不管是做panel也好,按年月生成变量也好,都方便些。
这个肯定都已经处理了,已经生成数值的变量放在后面,你可以假设你想要的时间变量都有了,有思路吗,随便说说也行。
PS:这种情况是不是叫跳跃面板啊?
gg

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-9 11:44