楼主: 姜小花花
2208 4

[数据管理求助] stata 生存分析(久期分析)如何定义数据格式 [推广有奖]

  • 0关注
  • 2粉丝

硕士生

13%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.0006
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
525 点
帖子
47
精华
0
在线时间
203 小时
注册时间
2019-4-2
最后登录
2021-7-21

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我想要研究影响企业生存的因素,要用到生存分析在stata中进行生存分析需要设定生存数据的格式。现有企业面板数据(98-13),同时考虑到左删失问题,所选样本成立年份为1998-2013年新成立的企业。具体包括:企业id;year;每一条数据包括了:哪个企业,在哪一年及是否发生退出事件等;
而在stata中进行生存分析的话,不知道面板型数据如何使用stset定义生存资料。
所以我想请问,在stata中如何将我的面板数据处理成进行生存分析所需要的格式呢?要怎样处理呢?
下面是整理的企业面板数据,包括企业id、year(存在年份)、exit(事件的结果,是否发生退出事件.exit=1为退出;exit=0为删失)、total_assets(财务数据)


  1. [CODE]
  2. * Example generated by -dataex-. To install: ssc install dataex
  3. clear
  4. input float id3 int year float exit double total_assets
  5. 1 2011 1 2646365
  6. 2 2008 0    6000
  7. 2 2009 0    3500
  8. 2 2010 0    4000
  9. 2 2011 0    4200
  10. 2 2012 0    4500
  11. 2 2013 0    6000
  12. 3 2008 0   84977
  13. 3 2009 0  112270
  14. 3 2010 0  136402
  15. 3 2011 0  145342
  16. 3 2012 0  184706
  17. 3 2013 0  216290
  18. 4 2008 0   44162
  19. 4 2009 0   55216
  20. 4 2010 0   72651
  21. 4 2011 0  133805
  22. 4 2012 0  225722
  23. 4 2013 0  447438
  24. 5 2008 0   21878
  25. 5 2009 0   21032
  26. 5 2010 0   79315
  27. 5 2011 0  112954
  28. 5 2012 0  168118
  29. 5 2013 0  151051
  30. 6 2008 0   23850
  31. 6 2009 0   28500
  32. 6 2010 0   25850
  33. 6 2011 0   37850
  34. 6 2012 1   50667
  35. 7 2006 0    3530
  36. 7 2007 1    5708
  37. 8 2008 0   68563
  38. 8 2009 0   68836
  39. 8 2010 0   74047
  40. 8 2011 0  135219
  41. 8 2012 0  221349
  42. 8 2013 0  590046
  43. 9 2008 1    9164
  44. 10 2006 0    5204
  45. 10 2007 1    5744
  46. 11 2008 0    7529
  47. 11 2009 0    7939
  48. 11 2010 0    6933
  49. 11 2011 0    7291
  50. 11 2012 0    7130
  51. 11 2013 0    8022
  52. 12 2008 0   19329
  53. 12 2009 0   36228
  54. 12 2010 0   62715
  55. 12 2011 0   70156
  56. 12 2012 0   88512
  57. 12 2013 0   96671
  58. 13 2008 0  151380
  59. 13 2009 0  229179
  60. 13 2010 0  315137
  61. 13 2011 0  395890
  62. 13 2012 0  456787
  63. 13 2013 0  516011
  64. 14 2008 0    5864
  65. 14 2009 0    7424
  66. 14 2010 0    7424
  67. 14 2011 0   26485
  68. 14 2012 0   28910
  69. 14 2013 0   29470
  70. 15 2008 0   10524
  71. 15 2009 0   12320
  72. 15 2010 1   12320
  73. 16 2008 0   32096
  74. 16 2009 0   36024
  75. 16 2010 0   86306
  76. 16 2011 0  114525
  77. 16 2012 0  168772
  78. 16 2013 0  220904
  79. 17 2007 0    3554
  80. 17 2008 0    3862
  81. 17 2009 0    3926
  82. 17 2010 0    4159
  83. 17 2011 0    4182
  84. 17 2012 0   22978
  85. 17 2013 0   25224
  86. 18 2010 0   14605
  87. 18 2011 0   16073
  88. 18 2012 0   16598
  89. 18 2013 0   18364
  90. 19 2008 0   23617
  91. 19 2009 0   25110
  92. 19 2010 0   70206
  93. 19 2011 0  100983
  94. 19 2012 0  155701
  95. 19 2013 0  209668
  96. 20 2008 0   29480
  97. 20 2009 0   27758
  98. 20 2010 1   25778
  99. 21 2010 1    4347
  100. 22 2008 0   11872
  101. 22 2009 0    9405
  102. 22 2010 1    9405
  103. end
复制代码

[/code]





自己通过 stset year,failure(exit) id(id3)的命令设定结果好像是错的,显示样本有重复观测值(如图所示)。看到的相关资料是以截面数据定义,像此类面板数据,一个样本id有多条观测值,不知道如何去设定? 1622256575(1).png
还请论坛的朋友大佬们可以帮帮我!这里困扰了很久,且后续无法进行下去了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata 数据格式 生存分析 tata Failure

沙发
华中农小硕 发表于 2021-6-17 16:08:12 |只看作者 |坛友微信交流群
请问解决了吗?

使用道具

藤椅
陈迁影 发表于 2021-9-11 10:01:29 |只看作者 |坛友微信交流群
请问楼主解决了吗

使用道具

板凳
zhw495450 发表于 2022-11-26 10:21:04 |只看作者 |坛友微信交流群
同问,请问这个问题怎么解决呢?我也是找了好久资料没看到解决办法

使用道具

报纸
wang177 发表于 2024-3-24 11:01:01 |只看作者 |坛友微信交流群
zhw495450 发表于 2022-11-26 10:21
同问,请问这个问题怎么解决呢?我也是找了好久资料没看到解决办法
你好,请问这个问题你解决了吗

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 19:06