從Python的 3 * 0.1 == 0.3 輸出False說浮點數的二進制

今天在學習Python核心編程的時候,十進制浮點數那段看到一個有趣的事情。

>>>0.1
0.1000000000000001

爲什麼會這樣?

這是因爲Python語言的浮點型實現遵守IEEE754規範。Python是使用其中53位用做指數偏移值,因此浮點值只能有53位精度,類似這樣的值用二進制表示只能像上面那樣被截斷。根據IEEE754規範,0.1的二進制表示是1.100110011001100110011001…*2-4 ,因爲它最接近的二進制近似值是0.0001100110011…,或1/16+1/32+1/256+…

意思就是四捨五入之後就變成0.1000000000000001了,上面這段話你很可能看得似懂非懂。

後來Python的更新解決了上述情況,將代碼截斷輸出,我在Python 3跟Python2.7中都試過,並沒有上述所說的這種問題。
但你可以試下

3 * 0.1 == 0.3

這段代碼輸出爲False

要解答上面這個0.1的輸出,咱們就需要一步步來了。

第一步,先把 0.1 轉成二進制

整數轉二進制大家肯定都知道的,這個就不說了,但是小數部分怎麼轉可能還是有些同學不知道。沒關係,附上鍊接:二進制十進制間小數怎麼轉換

0.1 = 1/16 + 1/32 + …
我簡單畫個圖,後面的位自己補上。

二進制 1/2 1/4 1/8 1/16 1/32 1/64 1/128 1/256 1/512 1/1024 1/2048
0 0 0 1 1 0 0 1 1 0 0

根據上面的方法繼續往下算可以知道十進制0.1的二進制就是0.00011001100110011…,移碼後就是

1.100110011001100110011001…*2-4

在轉碼的時候由於位數限制,後面部分精度被丟棄,也就是53位之後的精度,而這部分丟棄的位繼而導致在轉回10進制的時候精度丟失。
有興趣額瞭解的 IEEE 754 的同學可以看第二、三步,也可直接跳過。

第二步,大概瞭解下IEEE 754

IEEE 754 標準是IEEE二進位浮點數算術標準(IEEE Standard for Floating-Point Arithmetic)的標準編號,IEEE 754 標準規定了計算機程序設計環境中的二進制和十進制的浮點數自述的交換、算術格式以及方法。

參考:
百度百科 IEEE 754
維基百科 IEEE 754

這裏引用一段阮一峯的網絡日誌

根據國際標準IEEE 754,任意一個二進制浮點數V可以表示成下面的形式:

這裏寫圖片描述

(1) (-1)s 表示符號位,當s=0,V爲正數;當s=1,V爲負數。
(2) M表示有效數字,大於等於1,小於2。
(3) 2 E 表示指數位。

舉例來說,十進制的5.0,寫成二進制是101.0,相當於1.01×22。那麼,按照上面V的格式,可以得出s=0,M=1.01,E=2。

十進制的-5.0,寫成二進制是-101.0,相當於-1.01×22。那麼,s=1,M=1.01,E=2。

IEEE 754規定,對於32位的浮點數,最高的1位是符號位s,接着的8位是指數E,剩下的23位爲有效數字M。
這裏寫圖片描述
對於64位的浮點數,最高的1位是符號位S,接着的11位是指數E,剩下的52位爲有效數字M。
這裏寫圖片描述

IEEE 754對有效數字M和指數E,還有一些特別規定。

前面說過,1≤M<2,也就是說,M可以寫成1.xxxxxx的形式,其中xxxxxx表示小數部分。IEEE
754規定,在計算機內部保存M時,默認這個數的第一位總是1,因此可以被捨去,只保存後面的xxxxxx部分。比如保存1.01的時候,只保存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節省1位有效數字。以32位浮點數爲例,留給M只有23位,將第一位的1捨去以後,等於可以保存24位有效數字。

至於指數E,情況就比較複雜。

首先,E爲一個無符號整數(unsigned
int)。這意味着,如果E爲8位,它的取值範圍爲0255;如果E爲11位,它的取值範圍爲02047。但是,我們知道,科學計數法中的E是可以出現負數的,所以IEEE
754規定,E的真實值必須再減去一箇中間數,對於8位的E,這個中間數是127;對於11位的E,這個中間數是1023。

比如,210的E是10,所以保存成32位浮點數時,必須保存成10+127=137,即10001001。

然後,指數E還可以再分成三種情況:

(1)E不全爲0或不全爲1。這時,浮點數就採用上面的規則表示,即指數E的計算值減去127(或1023),得到真實值,再將有效數字M前加上第一位的1。

(2)E全爲0。這時,浮點數的指數E等於1-127(或者1-1023),有效數字M不再加上第一位的1,而是還原爲0.xxxxxx的小數。這樣做是爲了表示±0,以及接近於0的很小的數字。

(3)E全爲1。這時,如果有效數字M全爲0,表示±無窮大(正負取決於符號位s);如果有效數字M不全爲0,表示這個數不是一個數(NaN)。

第三步,把十進制 0.1 用32位bit位表示

0.1的二進制是1.100110011001100110011001…*2-4
根據公式 這裏寫圖片描述

正數符號位爲0;省略第一位的1,M爲100110011001100110011001;E=-4+127=123,二進制表示爲

可以得出 s=0,M=100 1100 1100 1100 1100 1100,E=0111 1011

所以寫成二進制形式是
0 10011001100110011001100 01111011

第四步,二進制轉回十進制

這個怎麼轉回10進制呢?剛剛十進制轉二進制是乘2得出每一位,那現在就是反過來,每一位除以2加起來就是了。
剛剛說的0.1的二進制

0.0001100110011…

轉回十進制大概是這樣

1*(2-4)+1*(2-5)+1*(2-8)+1*(2-9)+1*(2^-11)+…

由於53位之後的1被丟棄了,所以換算回十進制的時候導致精度不準確,算出來的結果會根據不同編程語言跟變量類型有所差異,多數情況下與原來輸入不同。

所以在編程的時候一定要注意浮點型的應用。建議在語言具備 decimal 類型的情況下選擇 decimal 。

由於 decimal 類型是將小數在十進制下移位成整數存儲,所以規避了上述問題。比如上述 0.1,decimal 類型會移位成 1 * 101, 分別存儲整數部分 1 與 指數部分 1。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章