在函數編程中經常用到閉包。閉包是什麼,它是怎麼產生的及用來解決什麼問題呢。給出字面的定義先:閉包是由函數及其相關的引用環境組合而成的實體(即:閉包=函數+引用環境)(想想Erlang的外層函數傳入一個參數a, 內層函數依舊傳入一個參數b, 內層函數使用a和b, 最後返回內層函數)。這個從字面上很難理解,特別對於一直使用命令式語言進行編程的程序員們。本文將結合實例代碼進行解釋。
函數是什麼
地球人都知道:函數只是一段可執行代碼,編譯後就“固化”了,每個函數在內存中只有一份實例,得到函數的入口點便可以執行函數了。在函數式編程語言中,函 數是一等公民(First class value:第一類對象,我們不需要像命令式語言中那樣藉助函數指針,委託操作函數),函數可以作爲另一個函數的參數或返回值,可以賦給一個變量。函數可 以嵌套定義,即在一個函數內部可以定義另一個函數,有了嵌套函數這種結構,便會產生閉包問題。如:
>>> def ExFunc(n):
sum=n
def InsFunc():
return sum+1
return InsFunc
>>> myFunc=ExFunc(10)
>>> myFunc()
>>> myAnotherFunc=ExFunc(20)
>>> myAnotherFunc()
>>> myFunc()
>>> myAnotherFunc()
>>>
在這段程序中,函數InsFunc是函數ExFunc的內嵌函數,並且是ExFunc函數的返回值。我們注意到一個問題:內嵌函數InsFunc中 引用到外層函數中的局部變量sum,IronPython會這麼處理這個問題呢?先讓我們來看看這段代碼的運行結果。當我們調用分別由不同的參數調用 ExFunc函數得到的函數時(myFunc(),myAnotherFunc()),得到的結果是隔離的,也就是說每次調用ExFunc函數後都將生成並保存一個新的局部變量sum。其實這裏ExFunc函數返回的就是閉包。
引用環境
按照命令式語言的規則,ExFunc函數只是返回了內嵌函數InsFunc的地址,在執行InsFunc函數時將會由於在其作用域內找不到sum變量而出 錯。而在函數式語言中,當內嵌函數體內引用到體外的變量時,將會把定義時涉及到的引用環境和函數體打包成一個整體(閉包)返回。現在給出引用環境的定義就 容易理解了:引用環境是指在程序執行中的某個點所有處於活躍狀態的約束(一個變量的名字和其所代表的對象之間的聯繫)所組成的集合。閉包的使用和正常的函 數調用沒有區別。
由於閉包把函數和運行時的引用環境打包成爲一個新的整體,所以就解決了函數編程中的嵌套所引發的問題。如上述代碼段中,當每次調用ExFunc函數 時都將返回一個新的閉包實例,這些實例之間是隔離的,分別包含調用時不同的引用環境現場。不同於函數,閉包在運行時可以有多個實例,不同的引用環境和相同 的函數組合可以產生不同的實例。
一,定義
python中的閉包從表現形式上定義(解釋)爲:如果在一個內部函數裏,對在外部作用域(但不是在全局作用域)的變量進行引用,那麼內部函數就被認爲是閉包(closure).這個定義是相對直白的,好理解的,不像其他定義那樣學究味道十足(那些學究味道重的解釋,在對一個名詞的解釋過程中又充滿了一堆讓人抓狂的其他陌生名詞,不適合初學者)。下面舉一個簡單的例子來說明。
>>>def addx(x):
>>> def adder(y): return x + y
>>> return adder
>>> c = addx(8)
>>> type(c)
<type 'function'>
>>> c.__name__
'adder'
>>> c(10)
結合這段簡單的代碼和定義來說明閉包:
如果在一個內部函數裏:adder(y)就是這個內部函數,
對在外部作用域(但不是在全局作用域)的變量進行引用:x就是被引用的變量,x在外部作用域addx裏面,但不在全局作用域裏,
則這個內部函數adder就是一個閉包。
再稍微講究一點的解釋是,閉包=函數塊+定義函數時的環境,adder就是函數塊,x就是環境,當然這個環境可以有很多,不止一個簡單的x。
二,使用閉包注意事項
1,閉包中是不能修改外部作用域的局部變量的
>>> def foo():
... m = 0
... def foo1():
... m = 1
... print m
...
... print m
... foo1()
... print m
...
>>> foo()
從執行結果可以看出,雖然在閉包裏面也定義了一個變量m,但是其不會改變外部函數中的局部變量m。
2,以下這段代碼是在python中使用閉包時一段經典的錯誤代碼
def foo():
a = 1
def bar():
a = a + 1
return a
return bar
這段程序的本意是要通過在每次調用閉包函數時都對變量a進行遞增的操作。但在實際使用時
>>> c = foo()
>>> print c()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "<stdin>", line 4, in bar
UnboundLocalError: local variable 'a' referenced before assignment
這是因爲在執行代碼 c = foo()時,python會導入全部的閉包函數體bar()來分析其的局部變量,python規則指定所有在賦值語句左面的變量都是局部變量,則在閉包bar()中,變量a在賦值符號"="的左面,被python認爲是bar()中的局部變量。再接下來執行print c()時,程序運行至a = a + 1時,因爲先前已經把a歸爲bar()中的局部變量,所以python會在bar()中去找在賦值語句右面的a的值,結果找不到,就會報錯。解決的方法很簡單
def foo():
a = [1]
def bar():
a[0] = a[0] + 1
return a[0]
return bar
只要將a設定爲一個容器就可以了。這樣使用起來多少有點不爽,所以在python3以後,在a = a + 1 之前,使用語句nonloacal a就可以了,該語句顯式的指定a不是閉包的局部變量。
3,還有一個容易產生錯誤的事例也經常被人在介紹python閉包時提起,我一直都沒覺得這個錯誤和閉包有什麼太大的關係,但是它倒是的確是在python函數式編程是容易犯的一個錯誤,我在這裏也不妨介紹一下。先看下面這段代碼
for i in range(3):
print i
在程序裏面經常會出現這類的循環語句,Python的問題就在於,當循環結束以後,循環體中的臨時變量i不會銷燬,而是繼續存在於執行環境中。還有一個python的現象是,python的函數只有在執行時,纔會去找函數體裏的變量的值。
flist = []
for i in range(3):
def foo(x): print x + i
flist.append(foo)
for f in flist:
f(2)
可能有些人認爲這段代碼的執行結果應該是2,3,4.但是實際的結果是4,4,4。這是因爲當把函數加入flist列表裏時,python還沒有給i賦值,只有當執行時,再去找i的值是什麼,這時在第一個for循環結束以後,i的值是2,所以以上代碼的執行結果是4,4,4.
解決方法也很簡單,改寫一下函數的定義就可以了。
for i in range(3):
def foo(x,y=i): print x + y
flist.append(foo)
三,作用
說了這麼多,不免有人要問,那這個閉包在實際的開發中有什麼用呢?閉包主要是在函數式開發過程中使用。以下介紹兩種閉包主要的用途。
用途1,當閉包執行完後,仍然能夠保持住當前的運行環境。
比如說,如果你希望函數的每次執行結果,都是基於這個函數上次的運行結果。我以一個類似棋盤遊戲的例子來說明。假設棋盤大小爲50*50,左上角爲座標系原點(0,0),我需要一個函數,接收2個參數,分別爲方向(direction),步長(step),該函數控制棋子的運動。棋子運動的新的座標除了依賴於方向和步長以外,當然還要根據原來所處的座標點,用閉包就可以保持住這個棋子原來所處的座標。
origin = [0, 0] # 座標系統原點
legal_x = [0, 50] # x軸方向的合法座標
legal_y = [0, 50] # y軸方向的合法座標
def create(pos=origin):
def player(direction,step):
# 這裏應該首先判斷參數direction,step的合法性,比如direction不能斜着走,step不能爲負等
# 然後還要對新生成的x,y座標的合法性進行判斷處理,這裏主要是想介紹閉包,就不詳細寫了。
new_x = pos[0] + direction[0]*step
new_y = pos[1] + direction[1]*step
pos[0] = new_x
pos[1] = new_y
#注意!此處不能寫成 pos = [new_x, new_y],原因在上文有說過
return pos
return player
player = create() # 創建棋子player,起點爲原點
print player([1,0],10) # 向x軸正方向移動10步
print player([0,1],20) # 向y軸正方向移動20步
print player([-1,0],10) # 向x軸負方向移動10步
輸出爲
[10, 0]
[10, 20]
[0, 20]
用途2,閉包可以根據外部作用域的局部變量來得到不同的結果,這有點像一種類似配置功能的作用,我們可以修改外部的變量,閉包根據這個變量展現出不同的功能。比如有時我們需要對某些文件的特殊行進行分析,先要提取出這些特殊行。
def make_filter(keep):
def the_filter(file_name):
file = open(file_name)
lines = file.readlines()
file.close()
filter_doc = [i for i in lines if keep in i]
return filter_doc
return the_filter
如果我們需要取得文件"result.txt"中含有"pass"關鍵字的行,則可以這樣使用例子程序
filter = make_filter("pass")
filter_result = filter("result.txt")
以上兩種使用場景,用面向對象也是可以很簡單的實現的,但是在用Python進行函數式編程時,閉包對數據的持久化以及按配置產生不同的功能,是很有幫助的