楼主: zxq997
714 7

[CDA] python清洗的坑点 [推广有奖]

  • 0关注
  • 0粉丝

教师

硕士生

2%

还不是VIP/贵宾

-

威望
0
论坛币
13475 个
通用积分
27.8909
学术水平
28 点
热心指数
30 点
信用等级
28 点
经验
671 点
帖子
49
精华
0
在线时间
124 小时
注册时间
2018-5-21
最后登录
2023-12-14

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

1.sum函数:

大家都知道sum是求和的意思。但是在里面贴加第二个参数的时候,是怎么回事呢

例:

  1. sum(range(5),-1)
复制代码

输出:

  1. 9
复制代码

明明和是10 ,为什么会输出9呢。

因为sum函数中第二个参数不是位置参数,不是从-1位置开始计算,而是开始值为-1,所以求和为sum(range(5))-1=9


2.pandas中的分组索引:

例如有2张表。字段名称分别为:

1.quna = [出发地,目的地,价格,路线名称,]

2.route =[出发地,目的地,路线总数]

如果想以出发地和目的地作为索引,求出平均价格,代码如下:


  1. quna<span style="font-family:
  2. 微软雅黑" lang="en-US">.groupby(["出发地","目的地"]<span style="font-family:
  3. 微软雅黑" lang="en-US">).mean()
复制代码

此时出来的格式为"出发地"和"目的地"为索引标签,如下:

1.png

如果想要根据这样的分组拼接第二张表格route,因为2张表格的索引不同,无法拼接,这样应该怎样?

第二张表格:

2.png

此时就会发现groupby函数有一个参数为as_index,默认为True.作用为是否转化为索引。

将as_index 设为False,就会得到和route表一样的格式了。

  1. quna<span style="font-family:
  2. 微软雅黑" lang="en-US">.groupby(["出发地","目的地"],as_index=False).mean()
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python pandas Index Group range

已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
充实每一天 + 100 + 3 + 3 + 3 精彩帖子

总评分: 论坛币 + 100  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

本帖被以下文库推荐

为你点赞!

使用道具

藤椅
充实每一天 发表于 2019-3-20 19:53:23 来自手机 |只看作者 |坛友微信交流群
已点赞~

使用道具

板凳
qwe0208 学生认证  发表于 2019-3-20 20:08:03 |只看作者 |坛友微信交流群
提醒楼主,尽量别用 微软雅黑,小心被收版权费

使用道具

报纸
hifinecon 发表于 2019-3-20 23:57:58 |只看作者 |坛友微信交流群

使用道具

地板
zxq997 发表于 2019-3-21 10:49:20 |只看作者 |坛友微信交流群
qwe0208 发表于 2019-3-20 20:08
提醒楼主,尽量别用 微软雅黑,小心被收版权费
ok,谢谢啦

使用道具

7
artra2012 在职认证  发表于 2019-3-21 11:42:58 |只看作者 |坛友微信交流群
为您点赞!!!

使用道具

8
291294878 发表于 2019-3-21 17:03:11 来自手机 |只看作者 |坛友微信交流群
zxq997 发表于 2019-3-21 10:49
ok,谢谢啦
不客气

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 06:57