問題:pandas組內排序,並在每個分組內按序打上序號
描述:
pandas dataframe 對dep_id組內的salary排序。希望給下面原本只有前三列的dataframe,添加上第四列。
等價於sql裏的排序函數 row_number() over() 功能
假設我已經建好了僅有前三列的dataframe,數據集命名爲 MyData,那麼解決方案如下:
MyData['sort_id'] = MyData['salary'].groupby(MyData['dep_id']).rank()
結果如下: