在數據清洗時,需要按照一定條件刪除某些數據樣本,利用布爾表達式、索引和
drop
方法可以實現。
1.pandas.drop()
df = df.drop(df[<some boolean condition>].index)
一個例子,刪除dataframe中滿足條件x
所在的行:
df_clear = df.drop(df[df['x']<0.01].index)
# 也可以使用多個條件
df_clear = df.drop(df[(df['x']<0.01) | (df['x']>10)].index) #刪除x小於0.01或大於10的行
ref:
https://stackoverflow.com/questions/13851535/delete-rows-from-a-pandas-dataframe-based-on-a-conditional-expression-involvinghttps://www.cnblogs.com/crazyant/p/11557980.html