在SQL中经常会遇到需要找出数据中分组后的小组前几的需求。用pandas如何实现呢?
经过查阅相关文章发现pandas中的rank()函数可以解决此类问题。
等价于sql里的排序函数 row_number() over() 功能
MyData[\'sort_id\'] = MyData[\'salary\'].groupby(MyData[\'dep_id\']).rank()
这时候就会多一列sort_id 我们可以直接取sort_id>N的即可找到topN
|
楼主: E170608110153YF
|
411
0
[学习笔记] 【学习笔记】在SQL中经常会遇到需要找出数据中分组后的小组前几的需求。用pan ... |
jg-xs1京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


