比如,我有如下数据集:
patients_id expire_flag
1 0
1 0
2 1
3 0
4 1
4 1
4 1
5 1
5 1
如上所示,patients_id表示病人住院次数,1号病人2次住院,2号、3号病人都住院1次,4号病人住院3次,5号病人住院2次。expire_flag代表病人的结局,0代表存活,1代表死亡。1号2号3号病人都没问题,但是4号和5号病人就有问题了,因为病人不可能死亡多次。多次住院的病人应该是最后一次住院才死亡,前几次住院都是存活的。所以我想把数据集整理成如下形式:
patients_id expire_flag
1 0
1 0
2 1
3 0
4 0
4 0
4 1
5 0
5 1
这在R中该怎么做到呢?数据量很大,不可能手动修改。


雷达卡




京公网安备 11010802022788号







