在SQL中经常会遇到需要找出数据中分组后的小组前几的需求。用pandas如何实现呢?
经过查阅相关文章发现pandas中的rank()函数可以解决此类问题。
等价于sql里的排序函数 row_number() over() 功能
MyData[\'sort_id\'] = MyData[\'salary\'].groupby(MyData[\'dep_id\']).rank()
这时候就会多一列sort_id 我们可以直接取sort_id>N的即可找到topN
楼主: E170608110153YF
|
283
0
[学习笔记] 【学习笔记】在SQL中经常会遇到需要找出数据中分组后的小组前几的需求。用pan ... |
京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明 免责及隐私声明