请选择 进入手机版 | 继续访问电脑版
楼主: caibirdcnb
770 0

[问答] 请问高手一个join算法 [推广有奖]

  • 0关注
  • 36粉丝

讲师

47%

还不是VIP/贵宾

-

威望
0
论坛币
1367 个
通用积分
16.5538
学术水平
67 点
热心指数
70 点
信用等级
64 点
经验
6762 点
帖子
206
精华
2
在线时间
433 小时
注册时间
2011-8-31
最后登录
2023-9-23

caibirdcnb 发表于 2016-6-4 23:06:39 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位高手,

我有数据集A和数据集B希望按照日期横向连接,目标是给A数据集添加weight信息。


其中A是一个大数据集有几百万行;B是一个小数据集只有几行,每个日期代表开始某个weight,例如下面的例子中,从1999-06-10至2002-11-22,weight是1.000,从2002-11-23开始weight是1.367。


按正常可以在数据集A新建一列把日期归类,例如1999-06-10至2002-11-22归类为1999-06-10。然后正常连接A,B。
if 1999-06-10<=date<2002-11-22 then date2 = 1999-06-10
else if 2002-11-23<=date<2004-01-01 then date2 = 2002-11-23
...


但在这个案例中,A和B的连接是在某个macro中进行的,当数据集B中的weight有新增时,需要修改上面日期归类语句。
而这是不允许的。


请问数据集A如何获得weight,同时,只需要更新B数据集呢?

谢谢!

A:
date               other columns
1999-05-23
1999-05-24
...
2008-07-05
...

B:
date               weight
1999-06-10     1.000
2002-11-23     1.367
2004-01-02     1.458
...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:join Weight Eight weigh 数据集 新建 信息

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 20:25