而在stata中进行生存分析的话,不知道面板型数据如何使用stset定义生存资料。
所以我想请问,在stata中如何将我的面板数据处理成进行生存分析所需要的格式呢?要怎样处理呢?
下面是整理的企业面板数据,包括企业id、year(存在年份)、exit(事件的结果,是否发生退出事件.exit=1为退出;exit=0为删失)、total_assets(财务数据)
- [CODE]
- * Example generated by -dataex-. To install: ssc install dataex
- clear
- input float id3 int year float exit double total_assets
- 1 2011 1 2646365
- 2 2008 0 6000
- 2 2009 0 3500
- 2 2010 0 4000
- 2 2011 0 4200
- 2 2012 0 4500
- 2 2013 0 6000
- 3 2008 0 84977
- 3 2009 0 112270
- 3 2010 0 136402
- 3 2011 0 145342
- 3 2012 0 184706
- 3 2013 0 216290
- 4 2008 0 44162
- 4 2009 0 55216
- 4 2010 0 72651
- 4 2011 0 133805
- 4 2012 0 225722
- 4 2013 0 447438
- 5 2008 0 21878
- 5 2009 0 21032
- 5 2010 0 79315
- 5 2011 0 112954
- 5 2012 0 168118
- 5 2013 0 151051
- 6 2008 0 23850
- 6 2009 0 28500
- 6 2010 0 25850
- 6 2011 0 37850
- 6 2012 1 50667
- 7 2006 0 3530
- 7 2007 1 5708
- 8 2008 0 68563
- 8 2009 0 68836
- 8 2010 0 74047
- 8 2011 0 135219
- 8 2012 0 221349
- 8 2013 0 590046
- 9 2008 1 9164
- 10 2006 0 5204
- 10 2007 1 5744
- 11 2008 0 7529
- 11 2009 0 7939
- 11 2010 0 6933
- 11 2011 0 7291
- 11 2012 0 7130
- 11 2013 0 8022
- 12 2008 0 19329
- 12 2009 0 36228
- 12 2010 0 62715
- 12 2011 0 70156
- 12 2012 0 88512
- 12 2013 0 96671
- 13 2008 0 151380
- 13 2009 0 229179
- 13 2010 0 315137
- 13 2011 0 395890
- 13 2012 0 456787
- 13 2013 0 516011
- 14 2008 0 5864
- 14 2009 0 7424
- 14 2010 0 7424
- 14 2011 0 26485
- 14 2012 0 28910
- 14 2013 0 29470
- 15 2008 0 10524
- 15 2009 0 12320
- 15 2010 1 12320
- 16 2008 0 32096
- 16 2009 0 36024
- 16 2010 0 86306
- 16 2011 0 114525
- 16 2012 0 168772
- 16 2013 0 220904
- 17 2007 0 3554
- 17 2008 0 3862
- 17 2009 0 3926
- 17 2010 0 4159
- 17 2011 0 4182
- 17 2012 0 22978
- 17 2013 0 25224
- 18 2010 0 14605
- 18 2011 0 16073
- 18 2012 0 16598
- 18 2013 0 18364
- 19 2008 0 23617
- 19 2009 0 25110
- 19 2010 0 70206
- 19 2011 0 100983
- 19 2012 0 155701
- 19 2013 0 209668
- 20 2008 0 29480
- 20 2009 0 27758
- 20 2010 1 25778
- 21 2010 1 4347
- 22 2008 0 11872
- 22 2009 0 9405
- 22 2010 1 9405
- end
[/code]
自己通过 stset year,failure(exit) id(id3)的命令设定结果好像是错的,显示样本有重复观测值(如图所示)。看到的相关资料是以截面数据定义,像此类面板数据,一个样本id有多条观测值,不知道如何去设定?
还请论坛的朋友大佬们可以帮帮我!这里困扰了很久,且后续无法进行下去了!