Python學記筆記(十):迭代器與生成器

迭代器和生成器

  • 迭代是Python最強大的功能之一,是訪問集合元素的一種方式。
  • 迭代器對象從集合的第一個元素開始訪問,直到所有的元素被訪問完結束。迭代器只能往前不會後退。
  • 迭代器是一個可以記住遍歷的位置的對象。

迭代

其實for .. in ..循環遍歷的過程就是迭代(iteration)
其他語言諸如C語言,迭代都是通過下標索引。所以可以看出,Python的for循環迭代抽象程度比其他語言高,不論有沒有下標,只要是可迭代對象(後文有介紹),都可以通過它迭代,比如字典。

迭代器

迭代器有兩個基本的方法:iter()next()
iter()用於創建一個迭代器對象
next()將參數中的迭代器進行一次迭代,並返回迭代器中的元素

>>> list = [1, 2, 3]
>>> l1 = iter(list)
>>> l1
<list_iterator object at 0x000001D5E98476A0>
>>> next(l1)
1
>>> next(l1)
2
>>> next(l1)
3
>>> next(l1)
Traceback (most recent call last):
  File "<input>", line 1, in <module>
StopIteration

迭代器到達結尾時,如果再調用next(),則會無法返回值而報錯StopIteration

爲自定義類創建迭代器

把一個類作爲一個迭代器使用需要在類中實現兩個方法 __iter__()__next__()

class my_nums():
    def __iter__(self):
        self.a = 1
        return self

    def __next__(self):
        if self.a < 20:
            x = self.a
            self.a += 1
            return x
        else:
            raise StopIteration


mn = my_nums()
l1 = iter(mn)
print(next(l1))
print(next(l1))
print(next(l1))
for i in mn:
    print(i, end=' ')

1
2
3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

  • 定義過兩個方法後的類的對象便成了可迭代對象,可以對其調用iter()next()以及對其進行for循環遍歷
  • StopIteration 異常用於標識迭代的完成,防止出現無限循環的情況,在__next__() 方法中我們可以設置在完成指定循環次數後觸發 StopIteration 異常來結束迭代。

生成器

通過列表生成式,我們可以直接創建一個列表,但是,受到內存限制,列表容量肯定是有限的,而且創建一個包含100萬個元素的列表,不僅佔用很大的存儲空間,如果我們僅僅需要訪問前面幾個元素,那後面絕大多數元素佔用的空間都白白浪費了。

所以,如果列表元素可以按照某種算法推算出來,那我們是否可以在循環的過程中不斷推算出後續的元素呢?這樣就不必創建完整的list,從而節省大量的空間,在Python中,這種一邊循環一邊計算的機制,稱爲生成器(generator)。 (轉自廖雪峯)

生成器是一個特殊的程序,可以被用作控制循環的迭代行爲,Python中生成器是迭代器的一種。

延遲計算或惰性求值 (Lazy evaluation)
迭代器不要求你事先準備好整個迭代過程中所有的元素。僅僅是在迭代至某個元素時才計算該元素,而在這之前或之後,元素可以不存在或者被銷燬。這個特點使得它特別適合用於遍歷一些巨大的或是無限的集合。


創建生成器的方法有很多。

列表生成器

回憶列表解析的內容。

squares = [x ** 2 for x in range(10)]

第一種創建生成器的方法是:只要把一個列表解析式的[]改成(),就創建了一個generator:

>>> L = [x ** 2 for x in range(10)]
>>> L
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> g = (x ** 2 for x in range(10))
>>> g
<generator object <genexpr> at 0x1022ef630>

如上所言,生成器就是迭代器,他可以被next()調用。

>>> g = (x ** 2 for x in range(10))
>>> next(g)
0
>>> next(g)
1
>>> next(g)
4

但是我們很少對生成器使用next(),大多數情況都是使用for循環,因爲生成器也是個可迭代對象

g = (x ** 2 for x in range(10))
for i in g:
	print(i, end=', ')

0, 1, 4, 9, 16, 25, 36, 49, 64, 81


生成器函數

另一個方法是:生成器函數。
在 Python 中,使用了 yield 的函數被稱爲生成器函數(generator function)
跟普通函數不同的是,生成器函數是一個返回迭代器的函數,只能用於迭代操作。

def odd():
	print('step 1')
	yield 1
	print('step 2')
	yield 3
	print('step 3')
	yield 5

o = odd()
print(next(o))
print(next(o))
print(next(o))
print(next(o))

step 1
1
step 2
3
step 3
5
Traceback (most recent call last):
File “D:/Pytest/1.py”, line 48, in
print(next(o))
StopIteration

在調用生成器運行的過程中,每次遇到 yield 時函數會暫停並保存當前所有的運行信息,返回 yield 的值, 並在下一次執行 next() 方法時從當前位置繼續運行。
比如上述函數:

  1. odd()返回的是一個迭代器,傳遞給變量o
  2. 第一次調用next():先打印step 1 ,再返回1,保存信息並停止運行函數。
  3. 第二次調用next():函數從原先停止的地方繼續,先打印step 2, 再返回3,保存信息並停止。
  4. 第三次調用next():…
  5. 第四次調用next():函數已到達末尾,無法返回值,報錯StopIteration



同理,生成器函數可以用for循環迭代:

# 例1 輸出奇數

def odd(n):
    cnt = 0
    while cnt < n:
        yield cnt * 2 + 1
        cnt += 1


for i in odd(5):
    print(i)

o = odd(4)
for i in o:
    print(i)

1
3
5
7
9
1
3
5
7

我們將剛纔的odd函數改編了一下,使其可以用傳遞參數來控制其循環次數。

# 例2 楊輝三角形

def triangle():
    a = [1]
    while True:
        yield a
        a = [1] + [a[i]+a[i-1] for i in range(1, len(a))] + [1]


n = 0
results = []
for t in triangle():
    print(t)
    results.append(t)
    n = n + 1
    if n == 10:
        break

[1]
[1, 1]
[1, 2, 1]
[1, 3, 3, 1]
[1, 4, 6, 4, 1]
[1, 5, 10, 10, 5, 1]
[1, 6, 15, 20, 15, 6, 1]
[1, 7, 21, 35, 35, 21, 7, 1]
[1, 8, 28, 56, 70, 56, 28, 8, 1]
[1, 9, 36, 84, 126, 126, 84, 36, 9, 1]

上述代碼在for循環中控制迭代次數。

可迭代對象

只要是實現了__iter__()__getitem__()方法的對象,就可以使用迭代器進行訪問。

  • 序列:字符串、列表、元組

  • 非序列:字典、文件

  • 自定義類:用戶自定義的類實現了__iter__()__getitem__()方法的對象

  • 生成器或者生成器函數


    可以使用isinstance()判斷一個對象是否是Iterable可迭代對象:

>>> from collections import Iterable
>>> isinstance([], Iterable) # 列表
True
>>> isinstance({}, Iterable) # 字典
True
>>> isinstance('abc', Iterable) # 字符串
True
>>> isinstance((x for x in range(10)), Iterable) # 這個是生成器
True
>>> isinstance(100, Iterable) # 普通數字
False
  • 可迭代≠是迭代器。除了生成器既是迭代器,也是可迭代對象,其他的可迭代對象都需要iter()來獲取其迭代器。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章