楼主: ljh971022
1708 2

[作业] pd.merge() 函数求解 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

大专生

96%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
1.0005
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
224 点
帖子
14
精华
0
在线时间
111 小时
注册时间
2020-1-1
最后登录
2021-11-29

楼主
ljh971022 发表于 2020-2-11 13:16:46 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
     我用pandas库建立了两个DataFrame:df1和df2,内容如下。df1.key是df2.key的一个子集,且df1.key的取值有重复。

截屏2020-02-1112.59.32.png

     现在需要按df1和df2的key,将df2的内容合并到df1中,建立一个8919行3列的DataFrame:df3。

     我使用的命令:df3 = pd.merge(df1, df2, on='key', how='inner'),但是结果却是一个427226行3列的DataFrame...如下:

截屏2020-02-1113.14.52.png

     想问下为什么会这样?如果要实现上述的合并(建立一个8919行3列的DataFrame),应该怎么写命令呢?
     谢谢!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


已有 1 人评分经验 收起 理由
yunnandlg + 80 精彩帖子

总评分: 经验 + 80   查看全部评分

沙发
hubert18 发表于 2020-2-16 11:39:04
how应该用left吧

藤椅
madworld1314 发表于 2020-3-2 16:17:13
最好发一个df.head()出来看看数据是什么情况的。
很有可能你的df2.key也是有重复的就会导致这样的情况。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-21 20:15