0.1 + 0.2 = 0.300000004 ?????
之前在知乎回答過這么個(gè)問題:「有哪些事實(shí)沒有一定計(jì)算機(jī)知識(shí)的人不會(huì)相信?」,收獲了不少贊。

我舉的例子是:0.1 + 0.2 計(jì)算的結(jié)果,大家肯定知道是等于 0.3 ,但是在計(jì)算機(jī)中 0.1 + 0.2 并不是等于 0.3,而是:

為什么會(huì)出現(xiàn)這個(gè)結(jié)果呢?這就需要一定計(jì)算機(jī)知識(shí)的人才會(huì)知道。
這篇文章其實(shí)發(fā)過,但是當(dāng)時(shí)閱讀不高,考慮到很多人沒看過,自己也修正了下之前的錯(cuò)別字,所以這次再跟大家分享下。
今天,我們來一步一步思考下面這些問題,然后最后再來說說為什么計(jì)算機(jī)里 0.1 + 0.2 != 0.3。
為什么負(fù)數(shù)要用補(bǔ)碼表示?
十進(jìn)制小數(shù)怎么轉(zhuǎn)成二進(jìn)制?
計(jì)算機(jī)是怎么存小數(shù)的?
0.1 + 0.2 == 0.3 嗎?
別看這些問題都看似簡(jiǎn)單,但是其實(shí)還是有點(diǎn)東西。
為什么負(fù)數(shù)要用補(bǔ)碼表示?
十進(jìn)制轉(zhuǎn)換二進(jìn)制的方法相信大家都熟能生巧了,如果你說你還不知道,我覺得你還是太謙虛,可能你只是忘記了,即使你真的忘記了,不怕,貼心的小林在和你一起回憶一下。
十進(jìn)制數(shù)轉(zhuǎn)二進(jìn)制采用的是除 2 取余法,比如數(shù)字 8 轉(zhuǎn)二進(jìn)制的過程如下圖:

接著,我們看看「整數(shù)類型」的數(shù)字在計(jì)算機(jī)的存儲(chǔ)方式,這其實(shí)很簡(jiǎn)單,也很直觀,就是將十進(jìn)制的數(shù)字轉(zhuǎn)換成二進(jìn)制即可。
我們以 int 類型的數(shù)字作為例子,int 類型是 32 位的,其中最高位是作為「符號(hào)標(biāo)志位」,正數(shù)的符號(hào)位是 0,負(fù)數(shù)的符號(hào)位是 1,剩余的 31 位則表示二進(jìn)制數(shù)據(jù)。
那么,對(duì)于 int 類型的數(shù)字 1 的二進(jìn)制數(shù)表示如下:

而負(fù)數(shù)就比較特殊了點(diǎn),負(fù)數(shù)在計(jì)算機(jī)中是以「補(bǔ)碼」表示的,所謂的補(bǔ)碼就是把正數(shù)的二進(jìn)制全部取反再加 1,比如 -1 的二進(jìn)制是把數(shù)字 1 的二進(jìn)制取反后再加 1,如下圖:

不知道你有沒有想過,為什么計(jì)算機(jī)要用補(bǔ)碼的方式來表示負(fù)數(shù)?在回答這個(gè)問題前,我們假設(shè)不用補(bǔ)碼的方式來表示負(fù)數(shù),而只是把最高位的符號(hào)標(biāo)志位變?yōu)?1 表示負(fù)數(shù),如下圖過程:

如果采用這種方式來表示負(fù)數(shù)的二進(jìn)制的話,試想一下 -2 + 1 的運(yùn)算過程,如下圖:

按道理,-2 + 1 = -1,但是上面的運(yùn)算過程中得到結(jié)果卻是 -3,所可以發(fā)現(xiàn),這種負(fù)數(shù)的表示方式是不能用常規(guī)的加法來計(jì)算了,就需要特殊處理,要先判斷數(shù)字是否為負(fù)數(shù),如果是負(fù)數(shù)就要把加法操作變成減法操作才可以得到正確對(duì)結(jié)果。
到這里,我們就可以回答前面提到的「負(fù)數(shù)為什么要用補(bǔ)碼方式來表示」的問題了。
如果負(fù)數(shù)不是使用補(bǔ)碼的方式表示,則在做基本對(duì)加減法運(yùn)算的時(shí)候,還需要多一步操作來判斷是否為負(fù)數(shù),如果為負(fù)數(shù),還得把加法反轉(zhuǎn)成減法,或者把減法反轉(zhuǎn)成加法,這就非常不好了,畢竟加減法運(yùn)算在計(jì)算機(jī)里是很常使用的,所以為了性能考慮,應(yīng)該要盡量簡(jiǎn)化這個(gè)運(yùn)算過程。
而用了補(bǔ)碼的表示方式,對(duì)于負(fù)數(shù)的加減法操作,實(shí)際上是和正數(shù)加減法操作一樣的。你可以看到下圖,用補(bǔ)碼表示的負(fù)數(shù)在運(yùn)算 -2 + 1 過程的時(shí)候,其結(jié)果是正確的:

十進(jìn)制小數(shù)與二進(jìn)制的轉(zhuǎn)換
好了,整數(shù)十進(jìn)制轉(zhuǎn)二進(jìn)制我們知道了,接下來看看小數(shù)是怎么轉(zhuǎn)二進(jìn)制的,小數(shù)部分的轉(zhuǎn)換不同于整數(shù)部分,它采用的是乘 2 取整法,將十進(jìn)制中的小數(shù)部分乘以 2 作為二進(jìn)制的一位,然后繼續(xù)取小數(shù)部分乘以 2 作為下一位,直到不存在小數(shù)為止。
話不多說,我們就以 8.625 轉(zhuǎn)二進(jìn)制作為例子,直接上圖:

最后把「整數(shù)部分 + 小數(shù)部分」結(jié)合在一起后,其結(jié)果就是 1000.101。
但是,并不是所有小數(shù)都可以用二進(jìn)制表示,前面提到的 0.625 小數(shù)是一個(gè)特例,剛好通過乘 2 取整法的方式完整的轉(zhuǎn)換成二進(jìn)制。
如果我們用相同的方式,來把 0.1 轉(zhuǎn)換成二進(jìn)制,過程如下:

可以發(fā)現(xiàn),0.1 的二進(jìn)制表示是無限循環(huán)的。
由于計(jì)算機(jī)的資源是有限的,所以是沒辦法用二進(jìn)制精確的表示 0.1,只能用「近似值」來表示,就是在有限的精度情況下,最大化接近 0.1 的二進(jìn)制數(shù),于是就會(huì)造成精度缺失的情況。
對(duì)于二進(jìn)制小數(shù)轉(zhuǎn)十進(jìn)制時(shí),需要注意一點(diǎn),小數(shù)點(diǎn)后面的指數(shù)冪是負(fù)數(shù)。
比如,二進(jìn)制 0.1 轉(zhuǎn)成十進(jìn)制就是 2^(-1),也就是十進(jìn)制 0.5,二進(jìn)制 0.01 轉(zhuǎn)成十進(jìn)制就是 2^-2,也就是十進(jìn)制 0.25,以此類推。
舉個(gè)例子,二進(jìn)制 1010.101 轉(zhuǎn)十進(jìn)制的過程,如下圖:

計(jì)算機(jī)是怎么存小數(shù)的?
1000.101 這種二進(jìn)制小數(shù)是「定點(diǎn)數(shù)」形式,代表著小數(shù)點(diǎn)是定死的,不能移動(dòng),如果你移動(dòng)了它的小數(shù)點(diǎn),這個(gè)數(shù)就變了, 就不再是它原來的值了。
然而,計(jì)算機(jī)并不是這樣存儲(chǔ)的小數(shù)的,計(jì)算機(jī)存儲(chǔ)小數(shù)的采用的是浮點(diǎn)數(shù),名字里的「浮點(diǎn)」表示小數(shù)點(diǎn)是可以浮動(dòng)的。
比如 1000.101 這個(gè)二進(jìn)制數(shù),可以表示成 1.000101 x 2^3,類似于數(shù)學(xué)上的科學(xué)記數(shù)法。
既然提到了科學(xué)計(jì)數(shù)法,我再幫大家復(fù)習(xí)一下。
比如有個(gè)很大的十進(jìn)制數(shù) 1230000,我們可以也可以表示成 1.23 x 10^6,這種方式就稱為科學(xué)記數(shù)法。
該方法在小數(shù)點(diǎn)左邊只有一個(gè)數(shù)字,而且把這種整數(shù)部分沒有前導(dǎo) 0 的數(shù)字稱為規(guī)格化,比如 1.0 x 10^(-9) 是規(guī)格化的科學(xué)記數(shù)法,而 0.1 x 10^(-9) 和 10.0 x 10^(-9) 就不是了。
因此,如果二進(jìn)制要用到科學(xué)記數(shù)法,同時(shí)要規(guī)范化,那么不僅要保證基數(shù)為 2,還要保證小數(shù)點(diǎn)左側(cè)只有 1 位,而且必須為 1。
所以通常將 1000.101 這種二進(jìn)制數(shù),規(guī)格化表示成 1.000101 x 2^3,其中,最為關(guān)鍵的是 000101 和 3 這兩個(gè)東西,它就可以包含了這個(gè)二進(jìn)制小數(shù)的所有信息:
000101稱為尾數(shù),即小數(shù)點(diǎn)后面的數(shù)字;3稱為指數(shù),指定了小數(shù)點(diǎn)在數(shù)據(jù)中的位置;
現(xiàn)在絕大多數(shù)計(jì)算機(jī)使用的浮點(diǎn)數(shù),一般采用的是 IEEE 制定的國(guó)際標(biāo)準(zhǔn),這種標(biāo)準(zhǔn)形式如下圖:

這三個(gè)重要部分的意義如下:
符號(hào)位:表示數(shù)字是正數(shù)還是負(fù)數(shù),為 0 表示正數(shù),為 1 表示負(fù)數(shù);
指數(shù)位:指定了小數(shù)點(diǎn)在數(shù)據(jù)中的位置,指數(shù)可以是負(fù)數(shù),也可以是正數(shù),指數(shù)位的長(zhǎng)度越長(zhǎng)則數(shù)值的表達(dá)范圍就越大;
尾數(shù)位:小數(shù)點(diǎn)右側(cè)的數(shù)字,也就是小數(shù)部分,比如二進(jìn)制 1.0011 x 2^(-2),尾數(shù)部分就是 0011,而且尾數(shù)的長(zhǎng)度決定了這個(gè)數(shù)的精度,因此如果要表示精度更高的小數(shù),則就要提高尾數(shù)位的長(zhǎng)度;
用 32 位來表示的浮點(diǎn)數(shù),則稱為單精度浮點(diǎn)數(shù),也就是我們編程語(yǔ)言中的 float 變量,而用 64 位來表示的浮點(diǎn)數(shù),稱為雙精度浮點(diǎn)數(shù),也就是 double 變量,它們的結(jié)構(gòu)如下:

可以看到:
double 的尾數(shù)部分是 52 位,float 的尾數(shù)部分是 23 位,由于同時(shí)都帶有一個(gè)固定隱含位(這個(gè)后面會(huì)說),所以 double 有 53 個(gè)二進(jìn)制有效位,float 有 24 個(gè)二進(jìn)制有效位,所以所以它們的精度在十進(jìn)制中分別是
log10(2^53)約等于15.95和log10(2^24)約等于7.22位,因此 double 的有效數(shù)字是15~16位,float 的有效數(shù)字是7~8位,這些是有效位是包含整數(shù)部分和小數(shù)部分;double 的指數(shù)部分是 11 位,而 float 的指數(shù)位是 8 位,意味著 double 相比 float 能表示更大的數(shù)值范圍;
那二進(jìn)制小數(shù),是如何轉(zhuǎn)換成二進(jìn)制浮點(diǎn)數(shù)的呢?
我們就以 10.625 作為例子,看看這個(gè)數(shù)字在 float 里是如何存儲(chǔ)的。

首先,我們計(jì)算出 10.625 的二進(jìn)制小數(shù)為 1010.101。
然后把小數(shù)點(diǎn),移動(dòng)到第一個(gè)有效數(shù)字后面,即將 1010.101 右移 3 位成 1.010101,右移 3 位就代表 +3,左移 3 位就是 -3。
float 中的「指數(shù)位」就跟這里移動(dòng)的位數(shù)有關(guān)系,把移動(dòng)的位數(shù)再加上「偏移量」,float 的話偏移量是 127,相加后就是指數(shù)位的值了,即指數(shù)位這 8 位存的是 10000010(十進(jìn)制 130),因此你可以認(rèn)為「指數(shù)位」相當(dāng)于指明了小數(shù)點(diǎn)在數(shù)據(jù)中的位置。
1.010101 這個(gè)數(shù)的小數(shù)點(diǎn)右側(cè)的數(shù)字就是 float 里的「尾數(shù)位」,由于尾數(shù)位是 23 位,則后面要補(bǔ)充 0,所以最終尾數(shù)位存儲(chǔ)的數(shù)字是 01010100000000000000000。
在算指數(shù)的時(shí)候,你可能會(huì)有疑問為什么要加上偏移量呢?
前面也提到,指數(shù)可能是正數(shù),也可能是負(fù)數(shù),即指數(shù)是有符號(hào)的整數(shù),而有符號(hào)整數(shù)的計(jì)算是比無符號(hào)整數(shù)麻煩的,所以為了減少不必要的麻煩,在實(shí)際存儲(chǔ)指數(shù)的時(shí)候,需要把指數(shù)轉(zhuǎn)換成無符號(hào)整數(shù)。
float 的指數(shù)部分是 8 位,IEEE 標(biāo)準(zhǔn)規(guī)定單精度浮點(diǎn)的指數(shù)取值范圍是 -126 ~ +127,于是為了把指數(shù)轉(zhuǎn)換成無符號(hào)整數(shù),就要加個(gè)偏移量,比如 float 的指數(shù)偏移量是 127,這樣指數(shù)就不會(huì)出現(xiàn)負(fù)數(shù)了。
比如,指數(shù)如果是 8,則實(shí)際存儲(chǔ)的指數(shù)是 8 + 127(偏移量)= 135,即把 135 轉(zhuǎn)換為二進(jìn)制之后再存儲(chǔ),而當(dāng)我們需要計(jì)算實(shí)際的十進(jìn)制數(shù)的時(shí)候,再把指數(shù)減去「偏移量」即可。
細(xì)心的朋友肯定發(fā)現(xiàn),移動(dòng)后的小數(shù)點(diǎn)左側(cè)的有效位(即 1)消失了,它并沒有存儲(chǔ)到 float 里。
這是因?yàn)?IEEE 標(biāo)準(zhǔn)規(guī)定,二進(jìn)制浮點(diǎn)數(shù)的小數(shù)點(diǎn)左側(cè)只能有 1 位,并且還只能是 1,既然這一位永遠(yuǎn)都是 1,那就可以不用存起來了。
于是就讓 23 位尾數(shù)只存儲(chǔ)小數(shù)部分,然后在計(jì)算時(shí)會(huì)自動(dòng)把這個(gè) 1 加上,這樣就可以節(jié)約 1 位的空間,尾數(shù)就能多存一位小數(shù),相應(yīng)的精度就更高了一點(diǎn)。
那么,對(duì)于我們?cè)趶?float 的二進(jìn)制浮點(diǎn)數(shù)轉(zhuǎn)換成十進(jìn)制時(shí),要考慮到這個(gè)隱含的 1,轉(zhuǎn)換公式如下:

舉個(gè)例子,我們把下圖這個(gè) float 的數(shù)據(jù)轉(zhuǎn)換成十進(jìn)制,過程如下:

0.1 + 0.2 == 0.3 ?
前面提到過,并不是所有小數(shù)都可以用「完整」的二進(jìn)制來表示的,比如十進(jìn)制 0.1 在轉(zhuǎn)換成二進(jìn)制小數(shù)的時(shí)候,是一串無限循環(huán)的二進(jìn)制數(shù),計(jì)算機(jī)是無法表達(dá)無限循環(huán)的二進(jìn)制數(shù)的,畢竟計(jì)算機(jī)的資源是有限。
因此,計(jì)算機(jī)只能用「近似值」來表示該二進(jìn)制,那么意味著計(jì)算機(jī)存放的小數(shù)可能不是一個(gè)真實(shí)值。
現(xiàn)在基本都是用 IEEE 754 規(guī)范的「單精度浮點(diǎn)類型」或「雙精度浮點(diǎn)類型」來存儲(chǔ)小數(shù)的,根據(jù)精度的不同,近似值也會(huì)不同。
那計(jì)算機(jī)是存儲(chǔ) 0.1 是一個(gè)怎么樣的二進(jìn)制浮點(diǎn)數(shù)呢?
偷個(gè)懶,我就不自己手動(dòng)算了,可以使用 binaryconvert 這個(gè)工具,將十進(jìn)制 0.1 小數(shù)轉(zhuǎn)換成 float 浮點(diǎn)數(shù):

可以看到,8 位指數(shù)部分是 01111011,23 位的尾數(shù)部分是 10011001100110011001101,可以看到尾數(shù)部分是 0011 是一直循環(huán)的,只不過尾數(shù)是有長(zhǎng)度限制的,所以只會(huì)顯示一部分,所以是一個(gè)近似值,精度十分有限。
接下來,我們看看 0.2 的 float 浮點(diǎn)數(shù):

可以看到,8 位指數(shù)部分是 01111100,稍微和 0.1 的指數(shù)不同,23 位的尾數(shù)部分是 10011001100110011001101 和 0.1 的尾數(shù)部分是相同的,也是一個(gè)近似值。
0.1 的二進(jìn)制浮點(diǎn)數(shù)轉(zhuǎn)換成十進(jìn)制的結(jié)果是 0.100000001490116119384765625:

0.2 的二進(jìn)制浮點(diǎn)數(shù)轉(zhuǎn)換成十進(jìn)制的結(jié)果是 0.20000000298023223876953125:

這兩個(gè)結(jié)果相加就是 0.300000004470348358154296875:

所以,你會(huì)看到在計(jì)算機(jī)中 0.1 + 0.2 并不等于完整的 0.3。
這主要是因?yàn)橛械男?shù)無法可以用「完整」的二進(jìn)制來表示,所以計(jì)算機(jī)里只能采用近似數(shù)的方式來保存,那兩個(gè)近似數(shù)相加,得到的必然也是一個(gè)近似數(shù)。
我們?cè)?JavaScript 里執(zhí)行 0.1 + 0.2,你會(huì)得到下面這個(gè)結(jié)果:

結(jié)果和我們前面推到的類似,因?yàn)?JavaScript 對(duì)于數(shù)字都是使用 IEEE 754 標(biāo)準(zhǔn)下的雙精度浮點(diǎn)類型來存儲(chǔ)的。
而我們二進(jìn)制只能精準(zhǔn)表達(dá) 2 除盡的數(shù)字 1/2, 1/4, 1/8,但是對(duì)于 0.1(1/10) 和 0.2(1/5),在二進(jìn)制中都無法精準(zhǔn)表示時(shí),需要根據(jù)精度舍入。
我們?nèi)祟愂煜さ氖M(jìn)制運(yùn)算系統(tǒng),可以精準(zhǔn)表達(dá) 2 和 5 除盡的數(shù)字,例如 1/2, 1/4, 1/5(0.2), 1/8, 1/10(0.1)。
當(dāng)然,十進(jìn)制也有無法除盡的地方,例如 1/3, 1/7,也需要根據(jù)精度舍入。
總結(jié)
最后,再來回答開頭多問題。
為什么負(fù)數(shù)要用補(bǔ)碼表示?
負(fù)數(shù)之所以用補(bǔ)碼的方式來表示,主要是為了統(tǒng)一和正數(shù)的加減法操作一樣,畢竟數(shù)字的加減法是很常用的一個(gè)操作,就不要搞特殊化,盡量以統(tǒng)一的方式來運(yùn)算。
十進(jìn)制小數(shù)怎么轉(zhuǎn)成二進(jìn)制?
十進(jìn)制整數(shù)轉(zhuǎn)二進(jìn)制使用的是「除 2 取余法」,十進(jìn)制小數(shù)使用的是「乘 2 取整法」。
計(jì)算機(jī)是怎么存小數(shù)的?
計(jì)算機(jī)是以浮點(diǎn)數(shù)的形式存儲(chǔ)小數(shù)的,大多數(shù)計(jì)算機(jī)都是 IEEE 754 標(biāo)準(zhǔn)定義的浮點(diǎn)數(shù)格式,包含三個(gè)部分:
符號(hào)位:表示數(shù)字是正數(shù)還是負(fù)數(shù),為 0 表示正數(shù),為 1 表示負(fù)數(shù);
指數(shù)位:指定了小數(shù)點(diǎn)在數(shù)據(jù)中的位置,指數(shù)可以是負(fù)數(shù),也可以是正數(shù),指數(shù)位的長(zhǎng)度越長(zhǎng)則數(shù)值的表達(dá)范圍就越大;
尾數(shù)位:小數(shù)點(diǎn)右側(cè)的數(shù)字,也就是小數(shù)部分,比如二進(jìn)制 1.0011 x 2^(-2),尾數(shù)部分就是 0011,而且尾數(shù)的長(zhǎng)度決定了這個(gè)數(shù)的精度,因此如果要表示精度更高的小數(shù),則就要提高尾數(shù)位的長(zhǎng)度;
用 32 位來表示的浮點(diǎn)數(shù),則稱為單精度浮點(diǎn)數(shù),也就是我們編程語(yǔ)言中的 float 變量,而用 64 位來表示的浮點(diǎn)數(shù),稱為雙精度浮點(diǎn)數(shù),也就是 double 變量。
0.1 + 0.2 == 0.3 嗎?
不是的,0.1 和 0.2 這兩個(gè)數(shù)字用二進(jìn)制表達(dá)會(huì)是一個(gè)一直循環(huán)的二進(jìn)制數(shù),比如 0.1 的二進(jìn)制表示為 0.0 0011 0011 0011… (0011 無限循環(huán)),對(duì)于計(jì)算機(jī)而言,0.1 無法精確表達(dá),這是浮點(diǎn)數(shù)計(jì)算造成精度損失的根源。
因此,IEEE 754 標(biāo)準(zhǔn)定義的浮點(diǎn)數(shù)只能根據(jù)精度舍入,然后用「近似值」來表示該二進(jìn)制,那么意味著計(jì)算機(jī)存放的小數(shù)可能不是一個(gè)真實(shí)值。
0.1 + 0.2 并不等于完整的 0.3,這主要是因?yàn)檫@兩個(gè)小數(shù)無法用「完整」的二進(jìn)制來表示,只能根據(jù)精度舍入,所以計(jì)算機(jī)里只能采用近似數(shù)的方式來保存,那兩個(gè)近似數(shù)相加,得到的必然也是一個(gè)近似數(shù)。
