有如下数据集,共1200个观测,3个变量,一个是观测序号id,想增加一个新的变量stage,变量值按id每隔3个数据赋给一新值stage,stage=1,2 ...并按stage 计算其他变量的平均值及总和。
如何实现?
id a b
1 12 15
2 23 14
3 17 21
4 11 19
5 9 13
6 18 24
... ... ...
1200
想要的数据集want1
id a b stage
1 12 15 1
2 23 14 1
3 17 21 1
4 11 19 2
5 9 13 2
6 18 24 2
... ... ... ...
1200 400
想要的数据集want2;
stage mean_a mean_b sum_a sum_b
1
2
3
...
400