楼主: zxq997
1060 7

[CDA] python清洗的坑点 [推广有奖]

  • 0关注
  • 0粉丝

教师

已卖:56份资源

硕士生

3%

还不是VIP/贵宾

-

威望
0
论坛币
13470 个
通用积分
27.8909
学术水平
28 点
热心指数
30 点
信用等级
28 点
经验
671 点
帖子
49
精华
0
在线时间
124 小时
注册时间
2018-5-21
最后登录
2024-6-27

楼主
zxq997 发表于 2019-3-20 17:44:06 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

1.sum函数:

大家都知道sum是求和的意思。但是在里面贴加第二个参数的时候,是怎么回事呢

例:

  1. sum(range(5),-1)
复制代码

输出:

  1. 9
复制代码

明明和是10 ,为什么会输出9呢。

因为sum函数中第二个参数不是位置参数,不是从-1位置开始计算,而是开始值为-1,所以求和为sum(range(5))-1=9


2.pandas中的分组索引:

例如有2张表。字段名称分别为:

1.quna = [出发地,目的地,价格,路线名称,]

2.route =[出发地,目的地,路线总数]

如果想以出发地和目的地作为索引,求出平均价格,代码如下:


  1. quna<span style="font-family:
  2. 微软雅黑" lang="en-US">.groupby(["出发地","目的地"]<span style="font-family:
  3. 微软雅黑" lang="en-US">).mean()
复制代码

此时出来的格式为"出发地"和"目的地"为索引标签,如下:

1.png

如果想要根据这样的分组拼接第二张表格route,因为2张表格的索引不同,无法拼接,这样应该怎样?

第二张表格:

2.png

此时就会发现groupby函数有一个参数为as_index,默认为True.作用为是否转化为索引。

将as_index 设为False,就会得到和route表一样的格式了。

  1. quna<span style="font-family:
  2. 微软雅黑" lang="en-US">.groupby(["出发地","目的地"],as_index=False).mean()
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python pandas Index Group range

已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
充实每一天 + 100 + 3 + 3 + 3 精彩帖子

总评分: 论坛币 + 100  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

本帖被以下文库推荐

沙发
经管之家编辑部 在职认证  发表于 2019-3-20 18:13:40
为你点赞!

藤椅
充实每一天 发表于 2019-3-20 19:53:23 来自手机
已点赞~

板凳
qwe0208 学生认证  发表于 2019-3-20 20:08:03
提醒楼主,尽量别用 微软雅黑,小心被收版权费

报纸
hifinecon 发表于 2019-3-20 23:57:58

地板
zxq997 发表于 2019-3-21 10:49:20
qwe0208 发表于 2019-3-20 20:08
提醒楼主,尽量别用 微软雅黑,小心被收版权费
ok,谢谢啦

7
artra2012 在职认证  发表于 2019-3-21 11:42:58
为您点赞!!!

8
291294878 发表于 2019-3-21 17:03:11 来自手机
zxq997 发表于 2019-3-21 10:49
ok,谢谢啦
不客气

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 15:53