#函數應用和映射
import numpy as np
import pandas as pd
df=pd.DataFrame(np.random.randn(4,3),columns=list('bde'),index=['utah','ohio','texas','oregon'])
print(df)
b d e
utah -0.451195 -0.183451 -0.297182
ohio 0.443792 0.925751 -1.320857
texas 1.039534 -0.927392 0.611482
oregon 0.938760 1.265244 0.313582
#將函數應用到由各列或行形成的一維數組上。DataFrame的apply方法可以實現此功能
f=lambda x:x.max()-x.min()
#默認情況下會以列爲單位,分別對列應用函數
t1=df.apply(f)
print(t1)
t2=df.apply(f,axis=1)
print(t2)
b 1.490729
d 2.192636
e 1.932339
dtype: float64
utah 0.267744
ohio 2.246608
texas 1.966925
oregon 0.951662
dtype: float64
#除標量外,傳遞給apply的函數還可以返回由多個值組成的Series
def f(x):
return pd.Series([x.min(),x.max()],index=['min','max'])
t3=df.apply(f)
#從運行的結果可以看出,按列調用的順序,調用函數運行的結果在右邊依次追加
print(t3)
b d e
min -0.451195 -0.927392 -1.320857
max 1.039534 1.265244 0.611482
#元素級的python函數,將函數應用到每一個元素
#將DataFrame中的各個浮點值保留兩位小數
f=lambda x: '%.2f'%x
t3=df.applymap(f)
print(t3)
b d e
utah -0.45 -0.18 -0.30
ohio 0.44 0.93 -1.32
texas 1.04 -0.93 0.61
oregon 0.94 1.27 0.31
#注意,這裏之所以叫applymap,是因爲Series有一個永遠元素級函數的map方法
t4=df['e'].map(f)
print(t4)
utah -0.30
ohio -1.32
texas 0.61
oregon 0.31
Name: e, dtype: object