python DataFrame的apply方法

#函數應用和映射
import numpy as np
import pandas as pd
df=pd.DataFrame(np.random.randn(4,3),columns=list('bde'),index=['utah','ohio','texas','oregon'])
print(df)

 b         d         e
utah   -0.451195 -0.183451 -0.297182
ohio    0.443792  0.925751 -1.320857
texas   1.039534 -0.927392  0.611482
oregon  0.938760  1.265244  0.313582

#將函數應用到由各列或行形成的一維數組上。DataFrame的apply方法可以實現此功能
f=lambda x:x.max()-x.min()
#默認情況下會以列爲單位,分別對列應用函數
t1=df.apply(f)
print(t1)
t2=df.apply(f,axis=1)
print(t2)
b    1.490729
d    2.192636
e    1.932339
dtype: float64
utah      0.267744
ohio      2.246608
texas     1.966925
oregon    0.951662
dtype: float64
#除標量外,傳遞給apply的函數還可以返回由多個值組成的Series
def f(x):
    return pd.Series([x.min(),x.max()],index=['min','max'])
t3=df.apply(f)
#從運行的結果可以看出,按列調用的順序,調用函數運行的結果在右邊依次追加
print(t3)
b         d         e
min -0.451195 -0.927392 -1.320857
max  1.039534  1.265244  0.611482
#元素級的python函數,將函數應用到每一個元素
#將DataFrame中的各個浮點值保留兩位小數
f=lambda x: '%.2f'%x
t3=df.applymap(f)
print(t3)
 b      d      e
utah    -0.45  -0.18  -0.30
ohio     0.44   0.93  -1.32
texas    1.04  -0.93   0.61
oregon   0.94   1.27   0.31
#注意,這裏之所以叫applymap,是因爲Series有一個永遠元素級函數的map方法
t4=df['e'].map(f)
print(t4)
utah      -0.30
ohio      -1.32
texas      0.61
oregon     0.31
Name: e, dtype: object

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章