请帮忙分析一下如何从data1生成data2的数据?谢谢!
附件是data1&data2,
具体变量取值定义见下:
1,state=5的情况之一:同一个ID,STATE从1开始到5了(first_date=第一次state=1的date1的值)则之后的一条记录的date1(此记录nextdate5=date1)与state=5的date1(date5_=date1)之间相差小于等于30天,则last_date的值为state=5之后state=1的最后一次date1的值;
2,state=5的情况之二:同一个ID,STATE从1开始到5了(first_date=第一次state=1的date1的值)则之后的一条记录的date1(此记录nextdate5=date1)与state=5的date1(date5_=date1)之间相差大于30天,则last_date的值为state=5的前一次state=1的date1的值;
3,state=2的情况:同一个ID,state从1开始到2了(first_date=第一次state=1的date1的值)则,date2_=date2的值,last_date的值为state=2的前一次state=1的date1的值;
4,state=3的情况:同一个ID,state从1开始到3了(first_date=第一次state=1的date1的值)则,date3_=date3的值,last_date的值为state=3的前一次state=1的date1的值;
5,state=4的情况:同一个ID,state从1开始到3了(first_date=第一次state=1的date1的值)则,date4_=date4的值,last_date的值为state=4的前一次state=1的date1的值;
6, state=1的情况:同一个ID,state一直都是1(first_date=第一次state=1的date1的值)则,last_date的值为最后一次state=1的date1的值;
7,所有观察均保留last_date对应的date1的那条记录.