另外,还需要对第3列的数据根据同一序列(第一列)进行加总,如何才能实现呢?
这些筛选后的数据,如何才能提取出来,生成在一个新的dataframe呢?
R小白,希望可以有大佬指点一下!如果我的思路过于绕,也希望可以请教一下更简单的处理方式。谢谢!
这是数据:
2 | 20190112 | 1 | 12 |
2 | 20190112 | 5 | 77 |
3 | 20190102 | 2 | 20.76 |
3 | 20190330 | 2 | 20.76 |
3 | 20190402 | 2 | 19.54 |
3 | 20191115 | 5 | 57.45 |
3 | 20191125 | 4 | 20.96 |
3 | 20200528 | 1 | 16.99 |
4 | 20190101 | 2 | 29.33 |
4 | 20190118 | 2 | 29.73 |
4 | 20190802 | 1 | 14.96 |
4 | 20191212 | 2 | 26.48 |
这是我的想法:
排序:2 3
20190112 20190102
20190112 20190330
20190402
20191115
20191125
20200528
选出最近的日期,如:2的是20190112 5 77
3的是20200528 1 16.99
根据序列号,第3列的加总,如:2 对应的是6
3 对应的是16