今天又遇到了這個問題,關於變量在函數內外定義以及修改的問題,在這裏簡要總結一下:
可變與不可變對象
首先這個問題歸根結底是Python變量機制中的可變與不可變對象,Python中萬物皆對象,簡單來說,不可變對象有這幾種:
int float str bool tuple
而可變對象有(一般自定義的類也是可變對象):
list set dict
所謂可變與不可變,也就是創建對象之後,會分配唯一一個id值,如果是可變對象,那麼這個對象的數值就是可變化的,如果是不可變對象,那麼它的數值就是不可變的,這裏要注意判斷是否爲同一個對象並不能以對象名爲依據,例如:
a = 1
print(a)
print(id(a))
a = a+1
print(a)
print(id(a))
輸出:
1
140715945029376
2
140715945029408
兩個對象的變量名稱都是 a
,但是使用id函數可以看出,這兩個對象不指向同一塊內存,是不同的對象。對於可變對象,則是:
a = [1,2,3]
print(a)
print(id(a))
a[0] = 100
print(a)
print(id(a))
輸出:
[1, 2, 3]
2303528409352
[100, 2, 3]
2303528409352
可以看到,儘管我們修改了值,但是兩個list都指向同一塊內存,是一個對象。
要說不可變對象完全不可變,也太過於絕對,最經典就是定義一個tuple,讓它的元素是list,那麼實際上tuple的值是可以改變的,本質上是間接改變的list的值,這有點感覺像是“鑽空子”,也不是那麼重要。
函數調用問題
對於函數調用函數外定義的對象,如果是不可變對象:
a = 5
def fun(a):
a += 5
print(a)
print(id(a))
print(a)
print(id(a))
fun(a)
print(a)
print(id(a))
輸出:
5
140715945029504
10
140715945029664
5
140715945029504
可以看到,這與C++等的函數一致,也就是不可變對象是傳值方式,如果在函數內部對這個對象進行改變,相當於臨時創建了一個局部變量(可以看到如果改變值,內存id就會改變),函數結束後不影響原來的對象。
如果需要在函數內改變全局對象,那麼就需要在函數內部將對象聲明成全局,使用 global
即可:
a = 5
def fun():
global a
print(id(a))
a += 5
print(a)
print(id(a))
print(a)
print(id(a))
fun()
print(a)
print(id(a))
輸出:
5
140715945029504
140715945029504
10
140715945029664
10
140715945029664
可以看到,在使用global定義函數內部的 a 是全局之後,在對它進行改變之後,函數外的內存id也改變了。
如果是可變對象:
a = [1,2,3]
def fun(a):
a[0] = 10
print(a)
print(id(a))
print(a)
print(id(a))
fun(a)
print(a)
print(id(a))
輸出:
[1, 2, 3]
2303528417224
[10, 2, 3]
2303528417224
[10, 2, 3]
2303528417224
這個好理解,直接傳遞引用,相當於直接修改全局對象,所以內存id都是一樣的。
關於 a += 1 和 a = a + 1 的問題
這是我今天剛遇到的問題,一開始是在寫函數的時候遇到的,例如:
a = np.array([1,2])
def fun(a):
print(id(a))
a = a-1
print(a)
print(id(a))
print(a)
print(id(a))
fun(a)
print(a)
print(id(a))
這段代碼輸出:
[1 2]
2303528368688
2303528368688
[0 1]
2303528368528
[1 2]
2303528368688
稍微改動一下:
a = np.array([1,2])
def fun(a):
print(id(a))
a -= 1
print(a)
print(id(a))
print(a)
print(id(a))
fun(a)
print(a)
print(id(a))
輸出:
[1 2]
2303528368528
2303528368528
[0 1]
2303528368528
[0 1]
2303528368528
兩段代碼僅僅改變了 a -= 1
與 a = a - 1
,可以看到,對於前者,所有的對象 a
的內存id都是一樣的,但是對於後者則是在這條語句之後改變了內存id,也就是對象改變了,如果不在函數中:
a = [1,2,3]
print(id(a))
a = a + [4]
print(a)
print(id(a))
輸出:
2303528464264
[1, 2, 3, 4]
2303528481544
第二種方式:
a = [1,2,3]
print(id(a))
a += [4]
print(id(a))
輸出:
2303527935432
2303527935432
可以看到,同樣,都是 a += 1這種方式不會改變對象,但是 a = a+1這種方式會改變對象,查了一些資料,總結一下,就是兩者看似相同,但是內部實現的方式並不同,首先是 +=
,這種方式會先調用 __iadd__
方法,這個方法會在元對象上進行改變,而= +
則是 使用__add__
方法,這個方法會返回一個對象,所以對象會改變,
更具體可見:Python 中 a+=b 和 a=a+b 的區別有哪些?
這裏要注意,上面的變化只是可變對象纔會發生,對於int等不可變對象,這兩種寫法是一樣的, 都會改變對象(因爲對於不可變對象,只有__add__
方法,都會返回一個新對象),例如:
a = 1
print(id(a))
a += 1
print(id(a))
輸出:
140715945029376
140715945029408
a = 1
print(id(a))
a = a + 1
print(id(a))
輸出:
print(id(a))
140715945029376
140715945029408
可以看到,都改變了對象。
簡單來說,
對於不可變對象, a -= b
與a = a - b
兩種寫法一樣,都會改變對象。
對於可變對象, a -= b
就相當於在原址上改變, a = a - b
則是先進行 a - b
運算,然後讓 a
再指向這個新值,所以改變了對象。
附註:我們知道:
a = [1,2,3]
b = a
print(id(a))
print(id(b))
這時候是傳遞的引用,也就是 b 也是指向 a 所在的內存塊的,所以修改一個就會修改另一個,但是如果我們希望深拷貝,完全複製一個,可以使用這個方法:
import copy
a = [1,2,3]
b = copy.deepcopy(a)
print(id(a))
print(id(b))
輸出:
2303527809800
2303528408008
更簡單的方式是使用切片:
a = [1,2,3]
b = a[:]
print(id(a))
print(id(b))
輸出:
2303528464840
2303528482568
這樣完成的也是深拷貝。