Python a = a + b 與 a+= b 問題

今天又遇到了這個問題,關於變量在函數內外定義以及修改的問題,在這裏簡要總結一下:

可變與不可變對象

首先這個問題歸根結底是Python變量機制中的可變與不可變對象,Python中萬物皆對象,簡單來說,不可變對象有這幾種:

int  float  str  bool  tuple

而可變對象有(一般自定義的類也是可變對象):

list  set  dict

所謂可變與不可變,也就是創建對象之後,會分配唯一一個id值,如果是可變對象,那麼這個對象的數值就是可變化的,如果是不可變對象,那麼它的數值就是不可變的,這裏要注意判斷是否爲同一個對象並不能以對象名爲依據,例如:

a = 1
print(a)
print(id(a))
a = a+1
print(a)
print(id(a))

輸出:

1
140715945029376
2
140715945029408

兩個對象的變量名稱都是 a ,但是使用id函數可以看出,這兩個對象不指向同一塊內存,是不同的對象。對於可變對象,則是:

a = [1,2,3]
print(a)
print(id(a))

a[0] = 100
print(a)
print(id(a))

輸出:

[1, 2, 3]
2303528409352
[100, 2, 3]
2303528409352

可以看到,儘管我們修改了值,但是兩個list都指向同一塊內存,是一個對象。
要說不可變對象完全不可變,也太過於絕對,最經典就是定義一個tuple,讓它的元素是list,那麼實際上tuple的值是可以改變的,本質上是間接改變的list的值,這有點感覺像是“鑽空子”,也不是那麼重要。

函數調用問題

對於函數調用函數外定義的對象,如果是不可變對象

a = 5
def fun(a):
    a += 5
    print(a)
    print(id(a))
print(a)  
print(id(a))
fun(a)
print(a)
print(id(a))

輸出:

5
140715945029504
10
140715945029664
5
140715945029504

可以看到,這與C++等的函數一致,也就是不可變對象是傳值方式,如果在函數內部對這個對象進行改變,相當於臨時創建了一個局部變量(可以看到如果改變值,內存id就會改變),函數結束後不影響原來的對象。
如果需要在函數內改變全局對象,那麼就需要在函數內部將對象聲明成全局,使用 global 即可:

a = 5
def fun():
    global a
    print(id(a))
    a += 5
    print(a)
    print(id(a))
print(a)  
print(id(a))
fun()
print(a)
print(id(a))

輸出:

5
140715945029504
140715945029504
10
140715945029664
10
140715945029664

可以看到,在使用global定義函數內部的 a 是全局之後,在對它進行改變之後,函數外的內存id也改變了。

如果是可變對象

a = [1,2,3]
def fun(a):
    a[0] = 10
    print(a)
    print(id(a))
    
print(a)
print(id(a))
fun(a)
print(a)
print(id(a))

輸出:

[1, 2, 3]
2303528417224
[10, 2, 3]
2303528417224
[10, 2, 3]
2303528417224

這個好理解,直接傳遞引用,相當於直接修改全局對象,所以內存id都是一樣的。

關於 a += 1 和 a = a + 1 的問題

這是我今天剛遇到的問題,一開始是在寫函數的時候遇到的,例如:

a = np.array([1,2])
def fun(a):
    print(id(a))
    a = a-1
    print(a)
    print(id(a))
print(a)
print(id(a))
fun(a)
print(a)
print(id(a))

這段代碼輸出:

[1 2]
2303528368688
2303528368688
[0 1]
2303528368528
[1 2]
2303528368688

稍微改動一下:

a = np.array([1,2])
def fun(a):
    print(id(a))
    a -= 1
    print(a)
    print(id(a))
print(a)
print(id(a))
fun(a)
print(a)
print(id(a))

輸出:

[1 2]
2303528368528
2303528368528
[0 1]
2303528368528
[0 1]
2303528368528

兩段代碼僅僅改變了 a -= 1a = a - 1,可以看到,對於前者,所有的對象 a 的內存id都是一樣的,但是對於後者則是在這條語句之後改變了內存id,也就是對象改變了,如果不在函數中:

a = [1,2,3]
print(id(a))
a = a + [4]
print(a)
print(id(a))

輸出:



2303528464264
[1, 2, 3, 4]
2303528481544

第二種方式:

a = [1,2,3]
print(id(a))
a += [4]
print(id(a))

輸出:

2303527935432
2303527935432

可以看到,同樣,都是 a += 1這種方式不會改變對象,但是 a = a+1這種方式會改變對象,查了一些資料,總結一下,就是兩者看似相同,但是內部實現的方式並不同,首先是 +=,這種方式會先調用 __iadd__方法,這個方法會在元對象上進行改變,而= +則是 使用__add__方法,這個方法會返回一個對象,所以對象會改變,

更具體可見:Python 中 a+=b 和 a=a+b 的區別有哪些?
這裏要注意,上面的變化只是可變對象纔會發生,對於int等不可變對象,這兩種寫法是一樣的, 都會改變對象(因爲對於不可變對象,只有__add__方法,都會返回一個新對象),例如:

a = 1
print(id(a))
a += 1
print(id(a))

輸出:

140715945029376
140715945029408
a = 1
print(id(a))
a = a + 1
print(id(a))

輸出:

print(id(a))
140715945029376
140715945029408

可以看到,都改變了對象。

簡單來說,
對於不可變對象a -= ba = a - b兩種寫法一樣,都會改變對象。
對於可變對象a -= b 就相當於在原址上改變, a = a - b則是先進行 a - b運算,然後讓 a再指向這個新值,所以改變了對象。

附註:我們知道:

a = [1,2,3]
b = a 
print(id(a))
print(id(b))

這時候是傳遞的引用,也就是 b 也是指向 a 所在的內存塊的,所以修改一個就會修改另一個,但是如果我們希望深拷貝,完全複製一個,可以使用這個方法:

import copy
a = [1,2,3]
b = copy.deepcopy(a)
print(id(a))
print(id(b))

輸出:

2303527809800
2303528408008

更簡單的方式是使用切片:

a = [1,2,3]
b = a[:]

print(id(a))
print(id(b))

輸出:

2303528464840
2303528482568

這樣完成的也是深拷貝。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章