以下内容转自 数析学院,只节选了部分,有需要的同学可以直接查看原文
介绍一些常用的 Dataframe 计算方法,包括:
1、分组后求和
2、提取日期元素
3、数据列运算
4、函数应用
5、运算时 null 值的处理
- import pandas as pd
- import numpy as np
- import sys
- %matplotlib inline
1、分组求和及长度
- df = pd.DataFrame({'group1':["a","a","b","b"],
- 'value':[10,20,30,40]
- })
- df
- group = df.groupby('group1')
- group.agg([len,sum])
2、添加 group.sum 列
- df = pd.DataFrame({'labels':["a","a","b","b"],
- 'value':[10,20,30,40]
- })
- df
- group = df.groupby('labels')['value']
- df['value.sum'] = group.transform('sum')
- df
以上内容转自 数析学院,后续内容有时间再补齐,有需要的同学可以直接查看原文


雷达卡




京公网安备 11010802022788号







