1.生成器(Generators)
首先我們要理解迭代器(iterators)。根據維基百科,迭代器是一個讓程序員可以遍歷一個容器(特別是列表)的對象。然而,一個迭代器在遍歷並讀取一個容器的數據元素時,並不會執行一個迭代。你可能有點暈了,那我們來個慢動作。換句話說這裏有三個部分:
- 可迭代對象(Iterable)
- 迭代器(Iterator)
- 迭代(Iteration)
上面這些部分互相聯繫。我們會先各個擊破來討論他們,然後再討論生成器(generators).
2.可迭代對象(Iterable)
Python中任意的對象,只要它定義了可以返回一個迭代器的__iter__
方法,或者定義了可以支持下標索引的__getitem__
方法,那麼它就是一個可迭代對象。簡單說,可迭代對象就是能提供迭代器的任意對象。那迭代器又是什麼呢?
3.迭代器(Iterator)
任意對象,只要定義了next
(Python2)
或者__next__
方法,它就是一個迭代器。就這麼簡單。現在我們來理解迭代(iteration)
4.迭代(Iteration)
用簡單的話講,它就是從某個地方(比如一個列表)取出一個元素的過程。當我們使用一個循環來遍歷某個東西時,這個過程本身就叫迭代。現在既然我們有了這些術語的基本理解,那我們開始理解生成器吧。
5.生成器(Generators)
生成器也是一種迭代器,但是你只能對其迭代一次。這是因爲它們並沒有把所有的值存在內存中,而是在運行時生成值。你通過遍歷來使用它們,要麼用一個“for”循環,要麼將它們傳遞給任意可以進行迭代的函數和結構。大多數時候生成器是以函數來實現的。然而,它們並不返回一個值,而是yield
(暫且譯作“生出”)一個值。這裏有個生成器函數的簡單例子:
def generator_function():
for i in range(10):
yield i
for item in generator_function():
print(item)
# Output: 0
# 1
# 2
# 3
# 4
# 5
# 6
# 7
# 8
# 9
這個案例並不是非常實用。生成器最佳應用場景是:你不想同一時間將所有計算出來的大量結果集分配到內存當中,特別是結果集裏還包含循環。
譯者注:這樣做會消耗大量資源
許多Python 2裏的標準庫函數都會返回列表,而Python 3都修改成了返回生成器,因爲生成器佔用更少的資源。
下面是一個計算斐波那契數列的生成器:
# generator version
def fibon(n):
a = b = 1
for i in range(n):
yield a
a, b = b, a + b
函數使用方法如下:
for x in fibon(1000000):
print(x)
用這種方式,我們可以不用擔心它會使用大量資源。然而,之前如果我們這樣來實現的話:
def fibon(n):
a = b = 1
result = []
for i in range(n):
result.append(a)
a, b = b, a + b
return result
這也許會在計算很大的輸入參數時,用盡所有的資源。我們已經討論過生成器使用一次迭代,但我們並沒有測試過。在測試前你需要再知道一個Python內置函數:next()
。它允許我們獲取一個序列的下一個元素。那我們來驗證下我們的理解:
def generator_function():
for i in range(3):
yield i
gen = generator_function()
print(next(gen))
# Output: 0
print(next(gen))
# Output: 1
print(next(gen))
# Output: 2
print(next(gen))
# Output: Traceback (most recent call last):
# File "<stdin>", line 1, in <module>
# StopIteration
我們可以看到,在yield
掉所有的值後,next()
觸發了一個StopIteration
的異常。基本上這個異常告訴我們,所有的值都已經被yield
完了。你也許會奇怪,爲什麼我們在使用for
循環時沒有這個異常呢?啊哈,答案很簡單。for
循環會自動捕捉到這個異常並停止調用next()
。你知不知道Python中一些內置數據類型也支持迭代哦?我們這就去看看:
my_string = "Yasoob"
next(my_string)
# Output: Traceback (most recent call last):
# File "<stdin>", line 1, in <module>
# TypeError: str object is not an iterator
好吧,這不是我們預期的。這個異常說那個str
對象不是一個迭代器。對,就是這樣!它是一個可迭代對象,而不是一個迭代器。這意味着它支持迭代,但我們不能直接對其進行迭代操作。那我們怎樣才能對它實施迭代呢?是時候學習下另一個內置函數,iter
。它將根據一個可迭代對象返回一個迭代器對象。這裏是我們如何使用它:
my_string = "Yasoob"
my_iter = iter(my_string)
next(my_iter)
# Output: 'Y'
現在好多啦。我肯定你已經愛上了學習生成器。一定要記住,想要完全掌握這個概念,你只有使用它。確保你按照這個模式,並在生成器對你有意義的任何時候都使用它。