python生成器與迭代器

  1. 生成器:

用列表生成式生成一個列表

[ i*2  for  i  in  range(10) ]

python生成器與迭代器

這就是一個列表生成式。
列表生成式使得創建列表代碼變得簡潔。但是,如果一個列表很大,這樣創建就比較耗內存了。如果列表元素可以按照某種算法推算出來,那我們就可以在循環過程中不斷推算出後續的元素,這樣就不用創建一個完整的list。從而節省內存空間。在python中這種一邊循環一邊計算的機制,就稱爲生成器(generator)。

要創建一個generator,有很多方法,第一種方法很簡單,只需要把一個列表生成式的[]換成()就創建了一個generator。
先寫一個簡單的生成器

#!/usr/bin/env python
# -- coding:utf-8 --
# 列表生成式
import datetime
import time
starttime1 = datetime.datetime.now()
b = ( i*2 for i in  range(100000000) )
for i in b:
    print i
    time.sleep(1)
endtime1 = datetime.datetime.now()
print (endtime1 - starttime1).seconds

我起了一個1核1G的虛機,如果上述代碼採用列表去循環程序直接OOM被killed了。但是我如果採用上述代碼只會在程序啓動的時候內存使用率偏高,之後幾乎很少佔用內存,這很明顯就體現了生成器的優勢。

generator非常強大。如果推算的算法比較複雜,還可以用函數來實現。
下面就來用生成器實現一個斐波那契數列。
斐波那契數列:除了第一個和第二個數之外,任意一個數都是由前面兩個數相加得到。在數學上,斐波納契數列以如下被以遞推的方法定義:F(1)=1,F(2)=1, F(n)=F(n-1)+F(n-2)(n>=3,n∈N*)
1,1,2,3,5,8...

def fibo(n):
    a,b = 0,1
    while n > 0:
        print b
        a,b = b,a+b
        n -= 1 
fibo(10)

生成這樣一個數列直接用類似列表生成式的方式就比較麻煩了,上述函數變成生成器只需要將print變成yield就可以了但是他將打印出來一個生成器而不是具體的數據,生成器是邊計算邊執行的它跟列表的不同之處就在於它只有一個next方法每一條數據都需要執行next方法才能得到。

#!/usr/bin/env python
def fibo(n):
    a,b = 0,1
    while n > 0:
        #print b
        yield b
        a,b = b,a+b
        n -= 1 
print fibo(10)
f = fibo(10)
print f.next()

輸出結果卻跟上邊的代碼有所不同
python生成器與迭代器

這裏只打印了第一個元素,因爲生成器是邊計算邊生成的,每調用一次next方法纔會由下一個值。要遍歷所有數據只要一個for循環即可:

#!/usr/bin/env python
def fibo(n):
    a,b = 0,1
    while n > 0:
        #print b
        yield b
        a,b = b,a+b
        n -= 1 
print fibo(10)
f = fibo(10)
for i in f:
    print i

這個yield關鍵字,改變了原有的函數執行流程,函數是順序執行,遇到return語句或者最後一行函數語句就返回。而變成generator的函數,在每次調用next()的時候執行,遇到yield語句返回,再次執行時從上次返回的yield語句處繼續執行。

2.迭代器:
可以直接用於for循環的對象統稱爲可迭代對象:Iterable。
一類是集合數據類型,如list、tuple、dict、set、str等;
一類是generator,包括生成器和帶yield的generator function。
可以使用isinstance()判斷一個對象是否是Iterable對象。

>>> from collections import Iterable
>>> isinstance([],Iterable)
True
>>> 
>>> isinstance({},Iterable)
True
>>> isinstance('abc', Iterable)
True
>>> isinstance((x for x in range(10)), Iterable)
True
>>> isinstance(10, Iterable)
False
>>> 

生成器不但可以作用於for循環,還可以被next()函數不斷調用並返回下一個值,直到最後拋出StopIteration錯誤表示無法繼續返回下一個值了。

可以被next()函數調用並不斷返回下一個值的對象稱爲迭代器:Iterator。

可以使用isinstance()判斷一個對象是否是Iterator對象:

>>> from collections import Iterator
>>> 
>>> isinstance((x for x in range(10)),Iterator)
True
>>> isinstance([],Iterator)
False
>>> isinstance({},Iterator)
False
>>> isinstance('abc', Iterator)
False
>>> 

生成器都是Iterator對象,但list、dict、str雖然是Iterable,卻不是Iterator。

把list、dict、str等Iterable變成Iterator可以使用iter()函數:

>>> isinstance(iter([]), Iterator)
True
>>> isinstance(iter('abc'), Iterator)
True

爲什麼list、dict、str等數據類型不是Iterator?
這是因爲Python的Iterator對象表示的是一個數據流,Iterator對象可以被next()函數調用並不斷返回下一個數據,直到沒有數據時拋出StopIteration錯誤。可以把這個數據流看做是一個有序序列,但我們卻不能提前知道序列的長度,只能不斷通過next()函數實現按需計算下一個數據,所以Iterator的計算是惰性的,只有在需要返回下一個數據時它纔會計算。
參考鏈接:https://www.liaoxuefeng.com/wiki/1016959663602400/1017323698112640

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章