| 数据集A | 数据集B | |||||
| date | group | no | date | group | no | |
| 2012-1-3 | a | 2 | 2012-1-8 | a | 4 | |
| 2012-1-11 | a | 4 | 2012-1-13 | a | 8 | |
| 2012-1-12 | a | 5 | 2012-1-18 | a | 4 | |
| 2012-1-6 | b | 3 | 2012-2-5 | b | 3 | |
| 2012-1-21 | b | 7 | 2012-3-8 | c | 2 | |
| 2012-2-8 | c | 11 | 2012-3-17 | c | 10 | |
| 2012-3-9 | c | 45 | 2012-1-17 | d | 4 | |
| 2012-5-10 | c | 2 | ||||
| 2012-1-11 | d | 113 | ||||
想得到的结果是针对B中每一条数据都要找到A中的一条数据相对应,并将B的"date"、"NO"连接到A数据集中,规则:A中满足”date"<=B中"date" 且 A 中“group"=B中“group"条件的所有数据中“NO”最大的数据,从B的第一条开始匹配,一旦匹配成功那么A中该条数据就不参与下一次匹配过程,有点类似不放回抽样。请各位大牛予以帮助,拜谢。



雷达卡



京公网安备 11010802022788号







