1.01 + 2.01 = 3.02
2.01 * 2.01 = 4 0401
不知你注意沒(méi)有,這個(gè)很尋常的等式,你如果將它放在C++中,Java中,Basic中,它
居然是不成立的。計(jì)算機(jī)在開(kāi)玩笑嗎?噢,對(duì)了,隱約記得這好象是浮點(diǎn)數(shù)的問(wèn)題,似乎
很多很多年前,老師說(shuō)過(guò)。還有某位姓林的先生在某本書(shū)里提過(guò)=0的判斷。
嗯,如果你不遇到此問(wèn)題,那你完全可以把它拋到火星上去,可惜,偶不好彩,這樣的
問(wèn)題,被俺遇到了。唉!
why?how?
沒(méi)辦法,硬著頭皮,從頭開(kāi)始。
一:為何不成立?Why?
這得從浮點(diǎn)數(shù)的在計(jì)算機(jī)內(nèi)的存儲(chǔ)開(kāi)始說(shuō)起,我這里閑話少說(shuō)。我們只談雙精度double
數(shù)(至于float,基本上是五十步和一百步的區(qū)別)。
雙精度數(shù)在計(jì)算機(jī)內(nèi)的表示方式是:(三部分組成)
符號(hào)(正或負(fù)) 階碼(2的N次冪) 尾數(shù)(大于等于1小于2的數(shù))
比如: -(符號(hào)) 1.01(尾數(shù)) * 2~1(N = 1) = - 2.02
具體到計(jì)算機(jī)的存儲(chǔ)單元:雙精度數(shù)共占8字節(jié)(64bit)
符號(hào)位(占1個(gè)bit) 階碼(11個(gè)bit) 尾數(shù)(52個(gè)bit)
解釋一下:
符號(hào)位:0表示正 1表示負(fù)
階碼:是一個(gè)偏移量,1023的偏移量,它的1023相當(dāng)于0,小于1023時(shí)為負(fù),
大于1023時(shí)為正,如:10000000001表示指數(shù)為1025 - 1023 = 2,表示真值為2^2。
好了,知道了原理,我們開(kāi)始分析上述等式為何為不等。
(相應(yīng)數(shù)的存儲(chǔ)值,可以簡(jiǎn)單用C語(yǔ)言的指針?lè)绞饺〕?
1.01 表示為:
0 0111111 1111 0000 00101000 11110101 11000010 10001111 01011100 00101001
2.01 表示為;
0 1000000 0000 0000 00010100 01111010 11100001 01000111 10101110 00010100
3.02 表示為:
0 1000000 0000 1000 00101000 11110101 11000010 10001111 01011100 00101001
2.01+1.01 在編程語(yǔ)言中的計(jì)算結(jié)果 表示為:
0 1000000 0000 1000 00101000 11110101 11000010 10001111 01011100 00101000
好了,我們可以比較一下3.02和計(jì)算結(jié)果,果然有所不同,只不過(guò)最后一個(gè)bit不同嘿。
為了驗(yàn)證一下,可以用手工計(jì)算一下2.01+1.01:
先把1.01的冪次變?yōu)?(與2.01的階碼相同),于是,將尾數(shù)右移一位。得到:
1000 00010100 01111010 11100001 01000111 10101110 000101001
加上2.01的尾數(shù)。
0000 00010100 01111010 11100001 01000111 10101110 00010100
得到:
1000 00101000 11110101 11000010 10001111 01011100 00101000
嗯,與計(jì)算機(jī)的計(jì)算結(jié)果相同,我們的運(yùn)算思路是正確的。
因此,結(jié)論出來(lái)了,因?yàn)?strong>浮點(diǎn)數(shù)在計(jì)算機(jī)內(nèi)的存儲(chǔ)存在偏差,導(dǎo)致運(yùn)算時(shí),與實(shí)際期望的結(jié)
果不同。很多時(shí)候,你可以不理它,但是,可以肯定負(fù)責(zé)任的說(shuō),發(fā)射衛(wèi)星的運(yùn)算時(shí),你
需要知道,否則,衛(wèi)星一轉(zhuǎn)眼就不見(jiàn)了。
二:不成立的的原因找到了,那怎么解決這個(gè)問(wèn)題呢,How?
一個(gè)簡(jiǎn)單的解決辦法是:
不要用浮點(diǎn)數(shù)來(lái)存儲(chǔ)浮點(diǎn),對(duì)于VC,Java,Basic,最好的辦法是用Decimal來(lái)保存它。
下面是分別的實(shí)現(xiàn):(以加法為例,其它四則運(yùn)算處理相同)
VC中:
double doublAdd(double dbl1, double dbl2)
{
double dblResult;
DECIMAL dec1,dec2,decResult;
::VarDecFromR8(dbl1,&dec1);
::VarDecFromR8(dbl2,&dec2);
::VarDecAdd(&dec1,&dec2,&decResult);
::VarR8FromDec(&decResult,&dblResult);
return dblResult;
}
VB中:
Private Function doubleAdd(ByVal dbl1 As Double, ByVal dbl2 As Double) As Double
doubleAdd = CDec(dbl1) + CDec(dbl2)
End Function
Java中:
public static double add(double v1, double v2) {
BigDecimal b1 = new BigDecimal(Double.toString(v1));
BigDecimal b2 = new BigDecimal(Double.toString(v2));
return b1.add(b2).doubleValue();
}
解決思路就是:用其它精確的表示法來(lái)存儲(chǔ)浮點(diǎn)數(shù),就這么簡(jiǎn)單。
注意:VC示例中,VarDecFromR8是做了手腳地,如果能直接用VarDecFromStr那更好。
三:在C/C++中,似乎很不情愿看到類(lèi)似上例中的代碼,因?yàn)樗雌饋?lái)很低效,還有其它方法嗎?
好象還有,對(duì)了,只是好象。
我們?cè)賮?lái)看看雙精度數(shù)的表示法:
尾數(shù)一共有52個(gè)bit,也就是最小能表示的數(shù)是 2^-52,取對(duì)數(shù)可得出,約是
在小數(shù)點(diǎn)后16位,那也就是說(shuō)小數(shù)點(diǎn)后15位是可以精確表示的,加上前置的默認(rèn)1,一共有16位
數(shù)字是精確可靠的。
我們來(lái)試驗(yàn)一下,看上述結(jié)論是否成立。
看看VC調(diào)試器的顯示值。
2.01 的顯示值: 2.0099999999999998
如果只取16位有效數(shù)字,那么將最后一位8四舍五入,我們得到正確的表示。
好了,這能說(shuō)明什么呢?
四:我們先看比較簡(jiǎn)單的加,減法運(yùn)算。
對(duì)于加法:dbl1 + dbl2:
假設(shè)dbl1=1.01 那么,16減去整數(shù)位1,我們可以假定,在計(jì)算機(jī)表示中:
小數(shù)點(diǎn)后的15位都是精確的。
假設(shè)dbl2=100.01 那么 16-3,假定小數(shù)點(diǎn)后13位是精確的。
憑經(jīng)驗(yàn)我們可以知道,兩個(gè)小數(shù)相加,小數(shù)點(diǎn)后的精度不會(huì)大于精度銷(xiāo)大的一個(gè)。
所以,我們判定得出結(jié)果的精確度可以用較大的一個(gè)為準(zhǔn)。
于是,將得出的結(jié)果,去掉不精確的位數(shù),則應(yīng)該可以得到準(zhǔn)確值。
VC實(shí)現(xiàn)如下:
#define DELTA_RATE 16
int getRound(double dbl)
{
COleVariant var(dbl);
COleVariant varForLog(dbl);
::VarRound(&varForLog,0,&varForLog);
int nIntCount = log10(varForLog.dblVal>0?varForLog.dblVal:-varForLog.dblVal) + 1;
int nRound = DELTA_RATE - nIntCount;
return nRound;
}
double doublAdd2(double dbl1, double dbl2)
{
COleVariant var(dbl1+dbl2);
int r1 = getRound(dbl1);
int r2 = getRound(dbl2);
::VarRound(&var,max(r1,r2),&var);
return var.dblVal;
}
做過(guò)一些實(shí)驗(yàn),好象是正確的。同理可以實(shí)現(xiàn)doubleSub2的函數(shù)。
注意:這里并不用下面五所提的取精度的方式,因?yàn)槿【鹊倪\(yùn)算更低效。
五:對(duì)于乘除法呢?問(wèn)題有些復(fù)雜,先找出一個(gè)需要處理的例子。
如:2.01*2.01=4.0401。
試了一下,不成立。
用方法一的Decimal方式測(cè)試,可以通過(guò)。
那么方法二呢?
再做假設(shè)吧,假設(shè)dbl1有兩位小數(shù),dbl2也有兩位小數(shù),按理論,
可得出相乘后,最大可能是2+2位小數(shù)。那么,我們按照 4位小數(shù)
進(jìn)行Round處理,可能會(huì)得出正確的結(jié)果。
實(shí)際上,要取一個(gè)雙精度的10進(jìn)制表達(dá)的小數(shù)位,我沒(méi)有找到什么好辦法,
我能想到的:也就是將數(shù)字轉(zhuǎn)為字串,然后查找.后的位數(shù)。這樣,顯然是
非常低效的,這里,我就不再寫(xiě)出代碼了。
六:比較方法一和方法二。方法二并不高效,并且還有一些不定因素,所以,
最好采用方法一來(lái)統(tǒng)一處理浮點(diǎn)數(shù)的運(yùn)算。
至于效率,實(shí)際上最佳方法是從程序的設(shè)計(jì)著手,將double從程序中去除掉。
比如在VC中,可以用Variant::Decimal來(lái)徹底替換double,這樣,就不存在
中間的轉(zhuǎn)換了,效率自然就提高了。有關(guān)Decimal的常用函數(shù)是:
VarDecFromStr VarDecAdd VarDecSub VarDecMul VarDecDiv ……
VarBstrFromDec
至于Java和VB,也可以方便的找到相應(yīng)函數(shù)。
很想找到一種更好的方法,總覺(jué)得用Decimal來(lái)進(jìn)行運(yùn)算很不爽,但真的沒(méi)找到?
其實(shí)呢,做了一下測(cè)試,Decimal的運(yùn)算并不慢,如果可以將內(nèi)部存儲(chǔ)改為Decimal,
那就可以徹底解決問(wèn)題了。