python迭代器,生成器

1. 迭代器

      迭代器是訪問集合元素的一種方式。迭代器對象從集合的第一個元素開始訪問,知道所有的元素被訪問完結束。迭代器只能往前不會後退,不過這也沒什麼,因爲人們很少在迭代途中往後退。

1.1 使用迭代器的優點

      對於原生支持隨機訪問的數據結構(如tuple、list),迭代器和經典for循環的索引訪問相比並無優勢,反而丟失了索引值(可以使用內建函數enumerate()找回這個索引值)。但對於無法隨機訪問的數據結構(比如set)而言,迭代器是唯一的訪問元素的方式。

      另外,迭代器的一大優點是不要求事先準備好整個迭代過程中所有的元素。迭代器僅僅在迭代到某個元素時才計算該元素,而在這之前或之後,元素可以不存在或者被銷燬。這個特點使得它特別適合用於遍歷一些巨大的或是無限的集合,比如幾個G的文件,或是斐波那契數列等等。

      迭代器更大的功勞是提供了一個統一的訪問集合的接口,只要定義了__iter__()方法對象,就可以使用迭代器訪問。

迭代器有兩個基本的方法

  • next方法:返回迭代器的下一個元素

  • __iter__方法:返回迭代器對象本身

下面用生成斐波那契數列爲例子,說明爲何用迭代器

代碼1

複製代碼

 def fab(max): 
    n, a, b = 0, 0, 1 
    while n < max: 
        print b 
        a, b = b, a + b 
        n = n + 1

複製代碼

直接在函數fab(max)中用print打印會導致函數的可複用性變差,因爲fab返回None。其他函數無法獲得fab函數返回的數列。

代碼2

複製代碼

 def fab(max): 
    L = []
    n, a, b = 0, 0, 1 
    while n < max: 
        L.append(b) 
        a, b = b, a + b 
        n = n + 1    return L

複製代碼

代碼2滿足了可複用性的需求,但是佔用了內存空間,最好不要。

代碼3

對比

 for i in range(1000): pass
 for i in xrange(1000): pass

前一個返回1000個元素的列表,而後一個在每次迭代中返回一個元素,因此可以使用迭代器來解決複用可佔空間的問題

複製代碼

 class Fab(object): 
    def __init__(self, max): 
        self.max = max 
        self.n, self.a, self.b = 0, 0, 1 

    def __iter__(self): 
        return self 

    def next(self): 
        if self.n < self.max: 
            r = self.b 
            self.a, self.b = self.b, self.a + self.b 
            self.n = self.n + 1 
            return r 
        raise StopIteration()

複製代碼

執行

>>> for key in Fabs(5):
    print key
 
     
1
1
2
3
5


Fabs 類通過 next() 不斷返回數列的下一個數,內存佔用始終爲常數 

1.2 使用迭代器

使用內建的工廠函數iter(iterable)可以獲取迭代器對象:

>>> lst = range(5)
>>> it = iter(lst)
>>> it
<listiterator object at 0x01A63110>

使用next()方法可以訪問下一個元素:

>>> it.next()
0
>>> it.next()
1
>>> it.next()
2

python處理迭代器越界是拋出StopIteration異常

>>> it.next()
3
>>> it.next
<method-wrapper 'next' of listiterator object at 0x01A63110>
>>> it.next()
4
>>> it.next()
 
Traceback (most recent call last):
  File "<pyshell#27>", line 1, in <module>
    it.next()
StopIteration

瞭解了StopIteration,可以使用迭代器進行遍歷了

複製代碼

lst = range(5)
it = iter(lst)try:    while True:
        val = it.next()        print valexcept StopIteration:    pass

複製代碼

結果

>>>
0
1
2
3
4

事實上,因爲迭代器如此普遍,python專門爲for關鍵字做了迭代器的語法糖。在for循環中,Python將自動調用工廠函數iter()獲得迭代器,自動調用next()獲取元素,還完成了檢查StopIteration異常的工作。如下

複製代碼

>>> a = (1, 2, 3, 4)>>> for key in a:    print key    
1
2
3
4

複製代碼

首先python對關鍵字in後的對象調用iter函數迭代器,然後調用迭代器的next方法獲得元素,直到拋出StopIteration異常。

1.3 定義迭代器
下面一個例子——斐波那契數列

複製代碼

# -*- coding: cp936 -*-class Fabs(object):    def __init__(self,max):
        self.max = max
        self.n, self.a, self.b = 0, 0, 1  #特別指出:第0項是0,第1項是第一個1.整個數列從1開始
    def __iter__(self):        return self    def next(self):        if self.n < self.max:
            r = self.b
            self.a, self.b = self.b, self.a + self.b
            self.n = self.n + 1            return r        raise StopIteration()print Fabs(5)for key in Fabs(5):    print key

複製代碼

結果

<__main__.Fabs object at 0x01A63090>
1
1
2
3
5

2. 迭代器

      帶有 yield 的函數在 Python 中被稱之爲 generator(生成器),幾個例子說明下(還是用生成斐波那契數列說明)

可以看出代碼3遠沒有代碼1簡潔,生成器(yield)既可以保持代碼1的簡潔性,又可以保持代碼3的效果

代碼4 

def fab(max):
    n, a, b = 0, 0, 1    while n < max:        yield b
        a, b = b, a + b
        n = n = 1

執行

>>> for n in fab(5):
    print n
 
     
1
1
2
3
5


簡單地講,yield 的作用就是把一個函數變成一個 generator,帶有 yield 的函數不再是一個普通函數,Python 解釋器會將其視爲一個 generator,調用 fab(5) 不會執行 fab 函數,而是返回一個 iterable 對象!在 for 循環執行時,每次循環都會執行 fab 函數內部的代碼,執行到 yield b 時,fab 函數就返回一個迭代值,下次迭代時,代碼從 yield b 的下一條語句繼續執行,而函數的本地變量看起來和上次中斷執行前是完全一樣的,於是函數繼續執行,直到再次遇到 yield。看起來就好像一個函數在正常執行的過程中被 yield 中斷了數次,每次中斷都會通過 yield 返回當前的迭代值。

也可以手動調用 fab(5) 的 next() 方法(因爲 fab(5) 是一個 generator 對象,該對象具有 next() 方法),這樣我們就可以更清楚地看到 fab 的執行流程:

>>> f = fab(3)
>>> f.next()
1
>>> f.next()
1
>>> f.next()
2
>>> f.next()
 
Traceback (most recent call last):
  File "<pyshell#62>", line 1, in <module>
    f.next()
StopIteration

return作用

在一個生成器中,如果沒有return,則默認執行到函數完畢;如果遇到return,如果在執行過程中 return,則直接拋出 StopIteration 終止迭代。例如

>>> s = fab(5)
>>> s.next()
1
>>> s.next()
 
Traceback (most recent call last):
  File "<pyshell#66>", line 1, in <module>
    s.next()
StopIteration

代碼5  文件讀取

複製代碼

 def read_file(fpath): 
    BLOCK_SIZE = 1024 
    with open(fpath, 'rb') as f: 
        while True: 
            block = f.read(BLOCK_SIZE) 
            if block: 
                yield block 
            else: 
                return

複製代碼

如果直接對文件對象調用 read() 方法,會導致不可預測的內存佔用。好的方法是利用固定長度的緩衝區來不斷讀取文件內容。通過 yield,我們不再需要編寫讀文件的迭代類,就可以輕鬆實現文件讀取。


https://blog.51cto.com/user_index.php?action=addblog_new&did=178525

3. 參考

Python函數式編程指南(三):迭代器

Python yield 使用淺析


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章