浮點數的存儲

讀了陳皓老師的魔數一文,對浮點數的存儲有了比較清晰的理解

float的存儲是32位的,而double的存儲方式是64位

存儲格式如下圖
浮點數的存儲

以64位雙精度來說

S是符號位,0爲正數,1爲負數
E是指數部分,11位可以表示的範圍是0~2047,爲了能表示負數,這11位表示的數範圍是-1023~1023

每個浮點數都可以表示爲2^n < 浮點數 < 2^(n+1)的形式
這裏的n+1023就是指數E,以3.14爲例子,2^1 < 3.14 < 2^2,E=1024
52bit可以表示的數是0~2^52-1,即2^52個數,我們可以把2^n~2^(n+1)分成2^52等份,看浮點佔了多少比例,以3.14爲例子,(3.14-2)/(4-2)=0.57,則0.57*2^52=2567051787601182.72,四捨五入M=2567051787601183

所以3.14在計算機中的存儲爲
0 10000000000 1001000111101011100001010001111010111000010100011111

浮點數的計算方式:
(-1)^S (1 + (M / 2^23)) (2 ^ E-127)
64位的就類似下面這個式子了
(-1)^S (1 + (M / 2^52)) (2 ^ E-1023)

(-1)^0 (1 + 0.57000000000000006217248937900877) (2 ^ 1) = 3.1400000000000001243449787580175
有一定的誤差

《完》

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章