有一个表格df1,包括id, t, dm, s这4列。其中
* id有重复。这里只列出id = 1,2的情况,但是真实数据中还有很多,id=1,2,...,100.
* t可以理解为时间,1-7天,或者1-7月等等。
* dm是另一个参数,要根据dm做一些lag。
* s是一些数值。
df1
根据这些来计算df2中x的值。具体算法如下:
当id = 1时,dm = 1。x的值比s的值滞后(lag)一行。
当id = 2时,dm有两个值(2和3)。
当dm = 2时, x的值比s的值滞后(lag)两行。
当dm = 3时, x的值比s的值滞后(lag)三行。
其中第12行的x值为0
df2
这个如何实现呢?
我已经试过left join,shift等办法,都没有搞定。


雷达卡







京公网安备 11010802022788号







