假如有一组数据(类似CLHLS、CHARLS和CFPS之类的追踪调查),不同受访者进入调查的时间不同、追踪的时间也不同,调查间隔的年份也不同。原始数据结构已经是一个人——年结构,但是年份不连续。这种情况下,如何构造符合事件史分析的数据,尤其是考虑时变变量。
以下面的数据为例:
- * Example generated by -dataex-. To install: ssc install dataex
- clear
- input double(id time age lnper78 follow death)
- 11000118 2019 105 7.791730059124416 2019 0
- [color=#ff0000]11000208 2011 93 7.350786034880141 2013 1[/color]
- [color=#ff0000]11000208 2008 90 7.077136824078388 2013 1[/color]
- 11000218 2019 102 7.791730059124416 2019 0
- [color=#ff0000]11000308 2008 90 6.384833474139839 2016 1[/color]
- [color=#ff0000]11000308 2011 93 7.342823001917441 2016 1[/color]
- [color=#ff0000]11000308 2014 96 8.18035844495322 2016 1[/color]
- 11000418 2019 103 0 2019 0
- 11000518 2019 102 7.386471498440371 2019 0
- 11000608 2008 101 7.6363907522304775 2010 1
- 11000618 2019 103 7.791750051061668 2019 0
- 11000708 2008 93 7.769861822158542 2009 1
- 11000718 2019 101 7.386471498440371 2019 0
- 11000808 2011 98 7.7072683340264145 2013 1
- 11000808 2008 95 7.664548224467979 2013 1
- 11000818 2019 101 8.484670649589589 2019 0
- 11000908 2008 87 7.769861822158542 2008 1
- 11001008 2011 91 8.21791412249666 2013 1
- 11001008 2008 88 8.270470746810775 2013 1
- 11001108 2008 88 5.875131851376592 2011 0
- end
- label values death death
- label def death 0 "存活/删失", modify
- label def death 1 "死亡", modify
相同id表示同一个人,time是调查时间,lnper78是调查年份的收入对数,death是是否死亡 follow是死亡年份。
谢谢大神指教,翻了很多书,没有找到类似情况的数据构造方式。


雷达卡


京公网安备 11010802022788号







