推導式comprehensions(又稱解析式),是Python的一種獨有特性。推導式是可以從一個數據序列構建另一個新的數據序列的結構體。 共有三種推導,在Python2和3中都有支持:
列表(list)推導式
字典(dict)推導式
集合(set)推導式
一、列表推導式
1、使用[]生成list
基本格式
[表達式 for 變量 in 列表] 或者 [表達式 for 變量 in 列表 if 條件]
例1: 過濾掉長度小於3的字符串列表,並將剩下的轉換成大寫字母
>> names = ['Bob','Tom','alice','Jerry','Wendy','Smith']
>> [name.upper() for name in names if len(name)>3]
['ALICE', 'JERRY', 'WENDY', 'SMITH']
生成間隔5分鐘的時間列表序列:
["%02d:%02d" %(h,m) for h in range(0, 24) for m in range(0, 60, 5)]
例2: 求(x,y)其中x是0-5之間的偶數,y是0-5之間的奇數組成的元祖列表
>> [(x,y) for x in range(5) if x%2==0 for y in range(5) if y %2==1]
[(0, 1), (0, 3), (2, 1), (2, 3), (4, 1), (4, 3)]
例3: 求M中3,6,9組成的列表
>> M = [[1,2,3],[4,5,6],[7,8,9]]
>> M
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>> [row[2] for row in M]
[3, 6, 9]
#或者用下面的方式
>> [M[row][2] for row in (0,1,2)]
[3, 6, 9]
例4: 求M中斜線1,5,9組成的列表
>> M
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>> [ M[i][i] for i in range(len(M))] 即打印 M[0][0],M[1][1],M[2][2]
[1, 5, 9]
例5: 求M,N中矩陣和元素的乘積
>> M = [[1,2,3],[4,5,6],[7,8,9]]
>> N = [[2,2,2],[3,3,3], [4,4,4]]
>> [M[row][col]N[row][col] for row in range(3) for col in range(3)]
[2, 4, 6, 12, 15, 18, 28, 32, 36]
>> [[M[row][col]N[row][col] for col in range(3)] for row in range(3)]
[[2, 4, 6], [12, 15, 18], [28, 32, 36]]
>> [[M[row][col]*N[row][col] for row in range(3)] for col in range(3)]
[[2, 12, 28], [4, 15, 32], [6, 18, 36]]
例5: 講字典中age鍵,按照條件賦新值
>> bob
{'pay': 3000, 'job': 'dev', 'age': 42, 'name': 'Bob Smith'}
>> sue
{'pay': 4000, 'job': 'hdw', 'age': 45, 'name': 'Sue Jones'}
>> people = [bob, sue]
>> [rec['age']+100 if rec['age'] >= 45 else rec['age'] for rec in people] # 注意for位置
[42, 145]
列表推導式總共有兩種形式:
①[x for x in data if condition]
此處if主要起條件判斷作用,data數據中只有滿足if條件的纔會被留下,最後統一生成爲一個數據列表
②[exp1 if condition else exp2 for x in data]
此處if...else主要起賦值作用,當data中的數據滿足if條件時將其做exp1處理,否則按照exp2處理,最後統一生成爲一個數據列表
例子如下:
data = ['driver', '2017-07-13', 1827.0, 2058.0, 978.0, 1636.0, 1863.0, 2537.0, 1061.0]
(1)若我要取得以上列表中值大於2000的數值,這裏可以使用列表推導式的形式①:
[x for x in data if x > 2000]
得到如下結果(字符串類型數據被認爲是無窮大數):
['driver', '2017-07-13', 2058.0, 2537.0]
(2)若要解決我上面提到的問題,則需要使用列表推導式的形式②
[int(x) if type(x) == float else x for x in data]
得到結果:
['driver', '2017-07-13', 1827, 2058, 978, 1636, 1863, 2537, 1061]
1、使用[]生成list
基本格式
variable = [out_exp_res for out_exp in input_list if out_exp == 2]
out_exp_res: 列表生成元素表達式,可以是有返回值的函數。
for out_exp in input_list: 迭代input_list將out_exp傳入out_exp_res表達式中。
if out_exp == 2: 根據條件過濾哪些值可以。
例一:
multiples = [i for i in range(30) if i % 3 is 0]
print(multiples)
Output: [0, 3, 6, 9, 12, 15, 18, 21, 24, 27]
例二:
def squared(x):
return x*x
multiples = [squared(i) for i in range(30) if i % 3 is 0]
print multiples
Output: [0, 9, 36, 81, 144, 225, 324, 441, 576, 729]
2、使用()生成generator
將倆表推導式的[]改成()即可得到生成器。
multiples = (i for i in range(30) if i % 3 is 0)
print(type(multiples))
Output: <type 'generator'>
二、字典推導式
字典推導和列表推導的使用方法是類似的,只不中括號該改成大括號。
{ key_expr: value_expr for value in collection if condition }
直接舉例說明:
l = ["%02d:%02d" %(h,m) for h in range(0, 24) for m in range(0, 60, 5)]
d = {key:0 for key in s}
print(d)
print(sorted(d.key()))
例1: 用字典推導式以字符串以及其長度建字典
>> strings = ['import','is','with','if','file','exception']
>> D = {key: val for val,key in enumerate(strings)}
>> D
{'exception': 5, 'is': 1, 'file': 4, 'import': 0, 'with': 2, 'if': 3}
例子一:大小寫key合併
mcase = {'a': 10, 'b': 34, 'A': 7, 'Z': 3}
mcase_frequency = {
k.lower(): mcase.get(k.lower(), 0) + mcase.get(k.upper(), 0)
for k in mcase.keys()
if k.lower() in ['a','b']
}
print mcase_frequency
Output: {'a': 17, 'b': 34}
例子二:快速更換key和value
mcase = {'a': 10, 'b': 34}
mcase_frequency = {v: k for k, v in mcase.items()}
print mcase_frequency
Output: {10: 'a', 34: 'b'}
三、集合推導式
它們跟列表推導式也是類似的。 唯一的區別在於它使用大括號{}。
{ expr for value in collection if condition }
例一:
squared = {x**2 for x in [1, 1, 2]}
print(squared)
Output: set([1, 4])
例1: 用集合推導建字符串長度的集合
>> strings = ['a','is','with','if','file','exception']
>> {len(s) for s in strings} #有長度相同的會只留一個,這在實際上也非常有用
set([1, 2, 4, 9])
嵌套列表是指列表中嵌套列表,比如說:
>> L = [[1,2,3],[4,5,6],[7,8,9]]
例1: 一個由男人列表和女人列表組成的嵌套列表,取出姓名中帶有兩個以上字母e的姓名,組成列表
names = [['Tom','Billy','Jefferson','Andrew','Wesley','Steven','Joe'],['Alice','Jill','Ana','Wendy','Jennifer','Sherry','Eva']]
用for循環實現:
tmp = []
for lst in names:
for name in lst:
if name.count('e') >= 2:
tmp.append(name)
print tmp
#輸出結果
>>
['Jefferson', 'Wesley', 'Steven', 'Jennifer']
用嵌套列表實現:
>> [name for lst in names for name in lst if name.count('e')>=2] #注意遍歷順序,這是實現的關鍵
['Jefferson', 'Wesley', 'Steven', 'Jennifer']