楼主: wangzhuo
4542 7

[其他] 关于Stata+面板数据的问题 [推广有奖]

  • 0关注
  • 0粉丝

大专生

50%

还不是VIP/贵宾

-

威望
0
论坛币
1210 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
596 点
帖子
73
精华
0
在线时间
24 小时
注册时间
2005-12-3
最后登录
2015-11-17

楼主
wangzhuo 发表于 2012-2-23 05:08:31 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
Stata 新手,请高手指点迷津,问题是这样的,
我想对面板数据(firm-year observations )进行处理,就是求SIC代码前两位相同的公司过去5年某一变量的percentile80的值,从1995-2005年每年对每一相同代码的公司都求出一个值。也就是每一年,把同一类型的公司过去5年的某一变量放在一起,求其中80分位数的值,请问应该如何求解,请高手解答。不知道是否表达清楚
是否需要编程啊?我还不太会编程,急!

非常感谢喔
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 面板数据 observations observation 如何

沙发
h3327156 发表于 2012-2-23 14:55:27
恁的SIC代码前两位相同的公司,关于SIC代码到底是字符变量或数值型变量?
可否贴出几个代码上来看看?
因为这个是我个人认为处理上比较麻烦的部份,因为要根据这个变量去分类。

您如果不想编程,我个人的猜测是statsby应当可以做到您要的,参考看看!

藤椅
wangzhuo 发表于 2012-2-24 00:05:24
sic
0100
0100
0100
0100
0100
0100
0100
0100
.......
9997
这就是SIC代码啦!多谢楼上朋友,您能不能具体帮我说说怎么做呢,我真是不太懂呢,非常感谢喔!我不知道怎样用金币,我会让版主把一部分金币加到您的账户里的,多谢啦!

板凳
wangzhuo 发表于 2012-2-24 03:44:30
我主要对过去5年的处理也不太明白,虽然看了一些朋友求标准差的例子

报纸
CATMO 发表于 2012-2-24 12:43:58
学习下

地板
h3327156 发表于 2012-2-26 08:10:39
************
处理代码的问题
g sic2=sic/100
g newsic=int(sic2)
************上面这个太简单,假设您的代码都是四位数,数值型

您的问题,我觉得颇难,因为您虽说从1995年开始,那么1995年时,往前推过去五年吗?
还有,过去五年,是观测的期间是五年? 还是六年?
问题的难度在于假设每一年,1995年时,那么要得出1990-1994年的吗
1996年时,则要得出1995-1999年的…
简言之,这属于固定时间区间的跳动…

其实有一种最快的方式,虽然那是个笨方法,但与其在想怎么用指令编程,
不如一年一年拆资料,然后把您要观测的时间区段,再整合成一套资料,
换句话说,就是每过去五年的资料,每一年给它算一次,那就好了!

以下是我利用Stata中的资料,去模拟您的状况,然后计算的结果,您参考看看!

***************
webuse pennxrate
***************
*34年,151国*****这里的id为151国家,这个变量,等同于您sic前两码相同的变量
*我假设从第9年开始观测,含这一年,也就是第 5 6 7 8 9 【过去五年】年
*那么同理,6 7 8 9 10 您知道意思的
*然后一路到30 31 32 33 34
***************
tab year,g(year)
local j 0
local p 0
local q 0
local r 0
forv i=5/30{
   local j=`i'+1
   local p=`i'+2
   local q=`i'+3
   local r=`i'+4
     g sw5`i'=year`i'+year`j'+year`p'+year`q'+year`r'
     bys id: egen p80c`i'=pctile(ppp) if sw5`i'==1,p(80)
}
**********************
*sw系列的变量创建就是一种0-1指标,代表该年度应该进去,即是过去五年
*ppp就是您所谓的某一变量
*p80c系列就是您要的

*您如果要套用,我个人认为年度那边的跳动要注意,请修改成您要跳动的时间区间

最后,一直到现在才有空回您这个帖子!  
原先我是打算放弃的! 因为您都没给资料,只给了sic代码,然后又一大堆,然后我又不清楚时间区段,
难不成要我自己设计?
【我这不是在对您说教,而是说真的,我有时不爱回答问题,大多是这种情况】

其实这个问题不难,拆解资料,或者弄到mata去做,会快很多,
但我总在想,如果采用变量的处理,那比较有挑战性,而且似乎也符合Stata的特色。

也许我提供的程序不是很完美,也或许对您没啥帮助,
但就我自己而言,或许透过这些演练与对问题的回答,
让我对Stata好像有些许更进一步的了解!

总之! 参考看看!                             

7
wangzhuo 发表于 2012-3-3 00:41:59
多谢上面这位朋友,我确实是没说清楚,资料是96年开始的,但我只关注2001-2010年的数据的变化,我想做个循环应该可以,我原来做时间序列分析,用Matlab做很简单的,但做面板数据就把我难住了,我还是个新手,慢慢学习吧,anyway,非常感谢~~

8
swufe2012 发表于 2012-3-6 21:06:05
wangzhuo 发表于 2012-3-3 00:41
多谢上面这位朋友,我确实是没说清楚,资料是96年开始的,但我只关注2001-2010年的数据的变化,我想做个循环 ...
可以用collapse 分组这个命令,我不知道你是不是这个意思。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-29 18:25