迭代器和生成器
- 迭代是Python最強大的功能之一,是訪問集合元素的一種方式。
- 迭代器對象從集合的第一個元素開始訪問,直到所有的元素被訪問完結束。迭代器只能往前不會後退。
- 迭代器是一個可以記住遍歷的位置的對象。
迭代
其實for .. in ..
循環遍歷的過程就是迭代(iteration)。
其他語言諸如C語言,迭代都是通過下標索引。所以可以看出,Python的for循環迭代抽象程度比其他語言高,不論有沒有下標,只要是可迭代對象(後文有介紹),都可以通過它迭代,比如字典。
迭代器
迭代器有兩個基本的方法:iter()
和 next()
。
iter()
用於創建一個迭代器對象
next()
將參數中的迭代器進行一次迭代,並返回迭代器中的元素
>>> list = [1, 2, 3]
>>> l1 = iter(list)
>>> l1
<list_iterator object at 0x000001D5E98476A0>
>>> next(l1)
1
>>> next(l1)
2
>>> next(l1)
3
>>> next(l1)
Traceback (most recent call last):
File "<input>", line 1, in <module>
StopIteration
迭代器到達結尾時,如果再調用next(),則會無法返回值而報錯StopIteration
。
爲自定義類創建迭代器
把一個類作爲一個迭代器使用需要在類中實現兩個方法 __iter__()
與 __next__()
。
class my_nums():
def __iter__(self):
self.a = 1
return self
def __next__(self):
if self.a < 20:
x = self.a
self.a += 1
return x
else:
raise StopIteration
mn = my_nums()
l1 = iter(mn)
print(next(l1))
print(next(l1))
print(next(l1))
for i in mn:
print(i, end=' ')
1
2
3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
- 定義過兩個方法後的類的對象便成了可迭代對象,可以對其調用
iter()
和next()
以及對其進行for循環遍歷 - StopIteration 異常用於標識迭代的完成,防止出現無限循環的情況,在
__next__()
方法中我們可以設置在完成指定循環次數後觸發 StopIteration 異常來結束迭代。
生成器
通過列表生成式,我們可以直接創建一個列表,但是,受到內存限制,列表容量肯定是有限的,而且創建一個包含100萬個元素的列表,不僅佔用很大的存儲空間,如果我們僅僅需要訪問前面幾個元素,那後面絕大多數元素佔用的空間都白白浪費了。
所以,如果列表元素可以按照某種算法推算出來,那我們是否可以在循環的過程中不斷推算出後續的元素呢?這樣就不必創建完整的list,從而節省大量的空間,在Python中,這種一邊循環一邊計算的機制,稱爲生成器(generator)。 (轉自廖雪峯)
生成器是一個特殊的程序,可以被用作控制循環的迭代行爲,Python中生成器是迭代器的一種。
延遲計算或惰性求值 (Lazy evaluation)
迭代器不要求你事先準備好整個迭代過程中所有的元素。僅僅是在迭代至某個元素時才計算該元素,而在這之前或之後,元素可以不存在或者被銷燬。這個特點使得它特別適合用於遍歷一些巨大的或是無限的集合。
創建生成器的方法有很多。
列表生成器
回憶列表解析的內容。
squares = [x ** 2 for x in range(10)]
第一種創建生成器的方法是:只要把一個列表解析式的[]改成(),就創建了一個generator:
>>> L = [x ** 2 for x in range(10)]
>>> L
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> g = (x ** 2 for x in range(10))
>>> g
<generator object <genexpr> at 0x1022ef630>
如上所言,生成器就是迭代器,他可以被next()調用。
>>> g = (x ** 2 for x in range(10))
>>> next(g)
0
>>> next(g)
1
>>> next(g)
4
但是我們很少對生成器使用next(),大多數情況都是使用for循環,因爲生成器也是個可迭代對象。
g = (x ** 2 for x in range(10))
for i in g:
print(i, end=', ')
0, 1, 4, 9, 16, 25, 36, 49, 64, 81
生成器函數
另一個方法是:生成器函數。
在 Python 中,使用了 yield
的函數被稱爲生成器函數(generator function)。
跟普通函數不同的是,生成器函數是一個返回迭代器的函數,只能用於迭代操作。
def odd():
print('step 1')
yield 1
print('step 2')
yield 3
print('step 3')
yield 5
o = odd()
print(next(o))
print(next(o))
print(next(o))
print(next(o))
step 1
1
step 2
3
step 3
5
Traceback (most recent call last):
File “D:/Pytest/1.py”, line 48, in
print(next(o))
StopIteration
在調用生成器運行的過程中,每次遇到 yield 時函數會暫停並保存當前所有的運行信息,返回 yield 的值, 並在下一次執行 next() 方法時從當前位置繼續運行。
比如上述函數:
- odd()返回的是一個迭代器,傳遞給變量o
- 第一次調用next():先打印step 1 ,再返回1,保存信息並停止運行函數。
- 第二次調用next():函數從原先停止的地方繼續,先打印step 2, 再返回3,保存信息並停止。
- 第三次調用next():…
- 第四次調用next():函數已到達末尾,無法返回值,報錯StopIteration
同理,生成器函數可以用for循環迭代:
# 例1 輸出奇數
def odd(n):
cnt = 0
while cnt < n:
yield cnt * 2 + 1
cnt += 1
for i in odd(5):
print(i)
o = odd(4)
for i in o:
print(i)
1
3
5
7
9
1
3
5
7
我們將剛纔的odd函數改編了一下,使其可以用傳遞參數來控制其循環次數。
# 例2 楊輝三角形
def triangle():
a = [1]
while True:
yield a
a = [1] + [a[i]+a[i-1] for i in range(1, len(a))] + [1]
n = 0
results = []
for t in triangle():
print(t)
results.append(t)
n = n + 1
if n == 10:
break
[1]
[1, 1]
[1, 2, 1]
[1, 3, 3, 1]
[1, 4, 6, 4, 1]
[1, 5, 10, 10, 5, 1]
[1, 6, 15, 20, 15, 6, 1]
[1, 7, 21, 35, 35, 21, 7, 1]
[1, 8, 28, 56, 70, 56, 28, 8, 1]
[1, 9, 36, 84, 126, 126, 84, 36, 9, 1]
上述代碼在for循環中控制迭代次數。
可迭代對象
只要是實現了__iter__()
或__getitem__()
方法的對象,就可以使用迭代器進行訪問。
-
序列:字符串、列表、元組
-
非序列:字典、文件
-
自定義類:用戶自定義的類實現了
__iter__()
或__getitem__()
方法的對象 -
生成器或者生成器函數
可以使用isinstance()
判斷一個對象是否是Iterable可迭代對象:
>>> from collections import Iterable
>>> isinstance([], Iterable) # 列表
True
>>> isinstance({}, Iterable) # 字典
True
>>> isinstance('abc', Iterable) # 字符串
True
>>> isinstance((x for x in range(10)), Iterable) # 這個是生成器
True
>>> isinstance(100, Iterable) # 普通數字
False
- 可迭代≠是迭代器。除了生成器既是迭代器,也是可迭代對象,其他的可迭代對象都需要
iter()
來獲取其迭代器。