我有一组数据大概长成这样:
Id time outcome
1 1 0
1 2 0
1 3 0
1 4 1
1 5 0
2 1 0
2 2 0
2 3 1
3 2 1
3 4 0
...
10 1 0
10 3 0
10 4 1
同id会随时间进行最多5次记录,然而现在的问题是有的ID的缺了前几次的数据记录,有的缺了后几次的,还有的缺了中间的。我现在想把缺失的数据补全,例如ID为2的缺了第4和第5次记录,则给他加上两行代表第4和第5次记录的新数据(outcome显示为NA即可)。换言之我想要的结果如下:
Id time outcome
1 1 0
1 2 0
1 3 0
1 4 1
1 5 0
2 1 0
2 2 0
2 3 1
2 4 NA
2 5 NA
3 1 NA
3 2 1
3 3 NA
3 4 0
3 5 NA
...
尝试了proc expand等很多种办法都没有用,求热心人士解答!