Lua的function、closure和upvalue

原創

2020-02-25 13:25

Lua 中的函數是一階類型值(first-class value)，定義函數就象創建普通類型值一樣(只不過函數類型值的數據主要是一條條指令而已)，
所以在函數體中仍然可以定義函數。假設函數f2定義在函數f1中，那麼就稱f2爲f1的內嵌(inner)函數，f1爲f2的外包(enclosing)函數，
外包和內嵌都具有傳遞性，即f2的內嵌必然是f1 的內嵌，而f1的外包也一定是f2的外包。
內嵌函數可以訪問外包函數已經創建的所有局部變量，這種特性便是所謂的詞法定界(lexical scoping)，而這些局部變量
則稱爲該內嵌函數的外部局部變量(external local variable)或者upvalue(這個詞多少會讓人產生誤解，因爲upvalue實際指的是變量而不是值)。

試看如下代碼：

---------------------------------------------------------------------------

function f1(n) -- 函數參數也是局部變量
    local function f2()
        print(n) -- 引用外包函數的局部變量
    end
    return f2
end
g1 = f1(1979)
g1() -- 打印出1979
g2 = f1(500)
g2() -- 打印出500

---------------------------------------------------------------------------

當執行完g1 = f1(1979)後，局部變量n的生命本該結束，但因爲它已經成了內嵌函數f2(它又被賦給了變量g1)的upvalue，
所以它仍然能以某種形式繼續“存活”下來，從而令g1()打印出正確的值。
可爲什麼g2與g1的函數體一樣(都是f1的內嵌函數f2的函數體)，但打印值不同？
這就涉及到一個相當重要的概念——閉包(closure)。事實上，Lua編譯一個函數時，會爲它生成一個原型(prototype)，
其中包含了函數體對應的虛擬機指令、函數用到的常量值(數，文本字符串等等)和一些調試信息。
在運行時，每當Lua執行一個形如function...end 這樣的表達式時，它就會創建一個新的數據對象，
其中包含了相應函數原型的引用、環境(environment，用來查找全局變量的表)的引用以及一個
由所有upvalue引用組成的數組，而這個數據對象就稱爲閉包。由此可見，函數是編譯期概念，是靜態的，
而閉包是運行期概念，是動態的。g1和g2的值嚴格來說不是函數而是閉包，並且是兩個不相同的閉包，
而每個閉包可以保有自己的upvalue值，所以g1和g2打印出的結果當然就不一樣了。
雖然閉包和函數是本質不同的概念，但爲了方便，且在不引起混淆的情況下，我們對它們不做區分。

使用upvalue很方便，但它們的語義也很微妙，需要引起注意。比如將f1函數改成：

---------------------------------------------------------------------------

function f1(n)
    local function f2()
        print(n)
    end
    n = n + 10
    return f2
end
g1 = f1(1979)
g1() -- 打印出1989

---------------------------------------------------------------------------

內嵌函數定義在n = n + 10這條語句之前，可爲什麼g1()打印出的卻是1989？
upvalue實際是局部變量，而局部變量是保存在函數堆棧框架上(stack frame)的，
所以只要upvalue還沒有離開自己的作用域，它就一直生存在函數堆棧上。
這種情況下，閉包將通過指向堆棧上的upvalue的引用來訪問它們，一旦upvalue即將離開自己的作用域
(這也意味着它馬上要從堆棧中消失)，閉包就會爲它分配空間並保存當前的值，
以後便可通過指向新分配空間的引用來訪問該upvalue。
當執行到f1(1979)的n = n + 10時，閉包已經創建了，但是n並沒有離開作用域，
所以閉包仍然引用堆棧上的n，當return f2完成時，n即將結束生命，此時閉包便將n(已經是1989了)
複製到自己管理的空間中以便將來訪問。弄清楚了內部的祕密後，運行結果就不難解釋了。

upvalue還可以爲閉包之間提供一種數據共享的機制。試看下例：

---------------------------------------------------------------------------

function Create(n)
    local function foo1()
        print(n)
    end
    local function foo2()
        n = n + 10
    end
    return foo1,foo2
end
f1,f2 = Create(1979)
f1() -- 打印1979
f2()
f1() -- 打印1989
f2()
f1() -- 打印1999

---------------------------------------------------------------------------

f1, f2這兩個閉包的原型分別是Create中的內嵌函數foo1和foo2，而foo1和foo2引用的upvalue是同一個，
即Create的局部變量 n。前面已說過，執行完Create調用後，閉包會把堆棧上n的值複製出來，
那麼是否f1和f2就分別擁有一個n的拷貝呢？其實不然，當Lua發現兩個閉包的upvalue指向的是當前堆棧上的相同變量時，
會聰明地只生成一個拷貝，然後讓這兩個閉包共享該拷貝，這樣任一個閉包對該upvalue進行修改都會被另一個探知。
上述例子很清楚地說明了這點：每次調用f2都將upvalue的值增加了10，隨後f1將更新後的值打印出來。
upvalue的這種語義很有價值，它使得閉包之間可以不依賴全局變量進行通訊，從而使代碼的可靠性大大提高。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Lua的function、closure和upvalue

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

挑戰程序設計競賽 2.3章習題 poj 3046 Ant Counting

Shell/Python中的用戶名獲取

從國外網站找到的 DirectX XAudio2 編程教程

“單例模式”文章收藏

使用LoadLibrary函數裝載一個DLL文件，沒有指定文件路徑，那麼操作系統搜索DLL文件的策略如下

編程知識彙總--OpenAL

編程知識彙總--轉載

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結