楼主: 慕目穆木
1508 3

请问python中如何实现类似dplyr的聚合计算? [推广有奖]

  • 0关注
  • 1粉丝

已卖:20份资源

硕士生

20%

还不是VIP/贵宾

-

威望
0
论坛币
56 个
通用积分
0.0001
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
5016 点
帖子
91
精华
0
在线时间
150 小时
注册时间
2016-9-8
最后登录
2019-2-25

楼主
慕目穆木 学生认证  发表于 2019-2-11 20:47:29 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
比如现在有一个数据集
name sex height weight
a  m 175 150
b  m 180 130
c   f  160   100
d   f  155   90

我要计算不同性别的平均身高,平均体重,身高/体重比 并且放在一个结果中
用dplyr我可以很简单的直接用
  1. df%>%group_by(sex)%>%      summarize(mean_weight=mean(weight),mean_height=mean(height),height_weight=height/weight)
复制代码
来让他们的结果作为一个数据狂返回

但是用python的groupby 我最多只能同时返回身高和体重的均值,像这种要做额外计算的话我提前需要自定义一个函数function,
  1. def function(df):
复制代码


请问大家有什么办法可以简单的进行数据聚合并且做一些计算而且可以按照数据框返回结果吗?



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python dplyr 如何实现 summarize function

沙发
慕目穆木 学生认证  发表于 2019-2-11 20:53:54
另外在dplyr中还可以非常轻松的在计算时进行筛选,比如,这个which的筛选方式在python中又要怎么实现呢……
  1. df%>%group_by(sex)%>%      summarize(mean_weight=mean(weight[which(name=='a')]))
复制代码

已有 1 人评分经验 收起 理由
我的素质低 + 100 精彩帖子

总评分: 经验 + 100   查看全部评分

藤椅
铁锷未残 学生认证  发表于 2019-2-13 10:52:45
可尝试在左手用R右手Python系列中查找方法
https://zhuanlan.zhihu.com/p/28235118
如果这可以帮助到你,请帮我评分,评分选项在我回复页面的右下方。
已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
我的素质低 + 100 + 10 精彩帖子
慕目穆木 + 1 + 1 + 1 + 1 精彩帖子

总评分: 经验 + 100  论坛币 + 11  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

板凳
tianjuhao 在职认证  发表于 2019-2-13 12:38:47
个人建议先熟练掌握R然后学一下python

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-8 09:33