楼主: zehui
8704 10

[编程问题求助] 如何计算组内排名前10的和 [推广有奖]

11
赵安豆 发表于 2024-6-8 12:32:17
你可以使用Pandas库来实现这个功能。以下是一个可能的步骤:

1. 首先,确保你已经导入了Pandas库:
```python
import pandas as pd
```

2. 然后,加载你的数据到一个DataFrame对象中,假设你的数据文件名为"data.csv":
```python
data = pd.read_csv("data.csv")
```

3. 接下来,按照city和year进行分组,并对GDP进行排序:
```python
grouped = data.groupby(["city", "year"])]["GDP"].apply(lambda x: x.rank(ascending=False)))
```

4. 然后,找出每个year下GDP排名前10的city,并计算它们的GDP总和:
```python
top_10_sum = grouped.groupby(level=[0, 1])).head(10).sum()
```

这样,`top_10_sum`变量就包含了各year下GDP排在前10的city的GDP总和。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-7 07:07