楼主: 我是小趴菜
291 0

[数据挖掘新闻] 根据行值合并pandas dataFrames [推广有奖]

  • 0关注
  • 4粉丝

教授

35%

还不是VIP/贵宾

-

威望
0
论坛币
29650 个
通用积分
380.5350
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
7150 点
帖子
670
精华
0
在线时间
37 小时
注册时间
2022-8-30
最后登录
2023-4-4

楼主
我是小趴菜 发表于 2022-11-10 10:15:34 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

我有两个.tsv文件,看起来像:


ID prop name size

A x rob 2

B y sally 3

C z debby 5

D w meg 6


ID lst_name area

A sanches 4

D smith 7

C roberts 8

我将它们加载到pandas DataFrames中并想要合并它们以便我得到一个新的dataFrame:


ID-name prop name size lst_name area

A x rob 2 sanches 4

B y sally 3

C z debby 5 roberts 8

D w meg 6 smith 7

我一直在努力实现这一目标,pd.merge()但遇到以下问题:


df = pd.DataFrame.from_csv("a.tsv", sep='\t')

df1 = pd.DataFrame.from_csv("b.tsv", sep='\t')

result = pd.merge(df, df1, how='inner',on=["ID","ID-name"])

有可能用熊猫完成这样的合并吗?

解决办法:您需要的是左连接(或外连接,当然取决于您的情况),因为在此示例中您还希望看到B的记录,即使它在df1上没有记录。


result = pd.merge(df, df1, how="left",on=["ID","ID"])


prop name size lst_name area

ID ID

A A x rob 2 sanches 4.0

B B y sally 3 NaN NaN

C C z debby 5 roberts 8.0

D D w meg 6 smith 7.0




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Dataframe frames pandas panda Frame

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-23 11:08