以下内容转自 数析学院,只节选了部分,有需要的同学可以直接查看原文
将介绍几种常见的 Dataframe 合并方法,包括:
1、合并不同日期索引的 Dataframe
2、按行合并
3、按索引合并
- import pandas as pd
- import sys
- %matplotlib inline
1、有两个以日期为索引的 Dataframe,其中一个 Dataframe 有时间戳,这种情况无法将两个 Dataframe 按照日期索引合到一起,那么要如何匹配时间戳呢?
- df1 = pd.DataFrame({'col1':[pd.Timestamp('20130102000030'),
- pd.Timestamp('2013-01-03 00:00:30'),
- pd.Timestamp('1/4/2013 000030')],
- 'col2':[1,10,18]
- })
- df1
- df1 = df1.set_index('col1')
- df1
- d = {'col2':[22,10,113]}
- i = [pd.Timestamp('20130102'),
- pd.Timestamp('2013-01-03'),
- pd.Timestamp('1/4/2013')]
-
- df2 = pd.DataFrame(data=d, index = i)
- df2.index.name = 'col1'
- df2
- # 如果我们尝试把两个 dataframe 加到一起,不会得到我们想要的结果
- df2+df1
- # 将 df2 的索引变得和 df1 一样
- # 用以前的已知值填写缺失的值
- #
- #2013-01-02 00:00:00 => 22
- #2013-01-02 00:00:30 => 22
- #2013-01-03 00:00:00 => 10
- #2013-01-03 00:00:00 => 10
- #2013-01-04 00:00:00 => 113
- #2013-01-04 00:00:00 => 113
- df2.reindex(df1.index, method='pad')
- # 现在我们可以把它们加起来
- df2 = df2.reindex(df1.index, method='pad')
- df1+df2
以上内容转自 数析学院,后续合并方法有时间再补齐,有需要的同学可以直接查看原文


雷达卡




京公网安备 11010802022788号







