|
在絕大多數(shù)情況下,生活中最重要的問題實際上只是一個概率問題。 -皮埃爾·西蒙·拉普拉斯 首先,講一個真實的故事。 我的幾個朋友生了第二個孩子。隨著妻子年齡的增長,醫(yī)生警告說你的孩子可能患有唐氏綜合癥。 朋友們很緊張,所以我該怎么辦? 醫(yī)生說羊膜穿刺術(shù)可以用來確認這是不是真的。 朋友們都很開心。 然而,醫(yī)生補充說羊膜穿刺術(shù)也可能失敗,你的孩子將會離開。 現(xiàn)在我的朋友們糾結(jié)在一起,一個是唐氏綜合癥,另一個是失去孩子。我怎樣才能做出決定? 醫(yī)生后來說,老年產(chǎn)婦患唐氏綜合征的概率約為2%,羊膜穿刺試驗失敗的概率約為1%。這很簡單,我們絕對不會這么做。 因此,我們發(fā)現(xiàn)一旦我們知道了某件事發(fā)生的確切概率,我們的決定就立刻變得簡單了。 但問題是,我們?nèi)绾沃肋@些概率? 許多人認為所謂的概率是經(jīng)過計算的。硬幣正面有50%,背面有50%。一個袋子里有100個球,30個黑色球和70個紅色球。挑出一個紅色球的概率是70%。 假設(shè)一個黑盒,你預(yù)先知道多少個黑球和紅球?事實上,在現(xiàn)實世界中,我們面臨的大多數(shù)情況都無法計算。它們都是黑匣子,需要根據(jù)概率來判斷。 頻率學(xué)派和貝葉斯學(xué)派 傳統(tǒng)方法被稱為頻率派。許多人不熟悉頻率和概率的區(qū)別。 簡而言之,概率指的是未來某件事發(fā)生的可能性,而頻率指的是某件事被觀察或測試的次數(shù)與總次數(shù)之比。 概率是事物本身的固有屬性和固定值,頻率是變化的。樣本越大,頻率越接近概率。 根據(jù)大數(shù)定律,當樣本無限時,頻率等于概率。 你扔硬幣10次,不一定是正面5次,背面5次,但你扔了10,000次,基本上是正面50%,背面50%。例如,在黑盒中,你不斷地從里面隨機取出球,并計算黑球和紅球的比例。當次數(shù)“足夠”時,你得到的頻率接近真實概率。 這種方法已經(jīng)使用了數(shù)百年,并且仍然被廣泛使用。例如,某些疾病的發(fā)病率、飛機和火車的事故概率等。都是基于大樣本統(tǒng)計來近似真實概率的。 然而,如果我們深入思考,我們會發(fā)現(xiàn)這種方法有兩個局限性: 首先,只有當你積累了一定數(shù)量的樣本,你才能對概率有一個初步的判斷。你只扔5次球,只拿10個球?;谛颖镜母怕屎芸赡苁清e誤的。 第二,如果黑盒足夠黑,你甚至不知道里面有多少個球,甚至不知道里面的球總數(shù)在變化,那么你就不能說什么是“足夠”。 在現(xiàn)實世界中,我們遇到了大量的問題,卻找不到這么多現(xiàn)成的數(shù)據(jù)。有許多新事物,根本沒有先例,新發(fā)現(xiàn)的疾病,新產(chǎn)品,新的市場策略,如何判斷概率?失明? 也對,也錯。 這需要貝葉斯學(xué)派。 貝葉斯學(xué)派的觀點是概率是一個主觀價值,這完全是我們自己的判斷。我可以先估計初始概率,然后根據(jù)新情況和新信息修改初始概率。隨著信息的增加,我將慢慢接近真實的概率。 這種方法很好地解決了頻率學(xué)派的兩個問題。我不必等到樣本積累到一定程度,我先猜一個,因為我有校正方法,我不在乎它是否“足夠”。不管怎樣,我已經(jīng)上路了。 貝葉斯學(xué)派自誕生以來已經(jīng)有200多年的爭議。甚至聯(lián)合創(chuàng)始人拉普拉斯也放棄了,因為每個人都認為這種摸石頭過河的方法太荒謬和不科學(xué)。 直到最近幾十年,隨著計算機技術(shù)的進步,它才光彩照人。現(xiàn)在人工智能、圖像識別、機器翻譯等都采用貝葉斯方法。 然后我們需要看看貝葉斯方法實際上是如何尋找石頭過河的。 托馬斯·貝葉斯 這部分涉及一些數(shù)學(xué)公式和計算,但只要求小學(xué)算術(shù)水平。 貝葉斯定理如下: A是你要考察的目標事件,P(A) 是這個目標事件的先驗概率,又叫初始概率,或者基礎(chǔ)概率。 B是新出現(xiàn)的一個新事件。P(A|B) 的意思是當B出現(xiàn)時A的概率,在這里就是我們需要的后驗概率。 P(B|A) 是當A出現(xiàn)時B的概率。 P(B) 是B出現(xiàn)的概率,在這里具體計算稍微復(fù)雜一些,指當A出現(xiàn)時B的概率和當A不出時(用A_來表示)時B的概率的總和,用公式表達就是 P(B) = P(B|A) * P(A) + P(B|A_) * P(A_)。P(B|A) / P(B) 可以看作一個修正因子。 上述解釋你可以忽略,簡化的理解為: 后驗概率 = 先驗概率 x 修正因子
舉個例子。 比如你新進入一家公司,你不確定這里MBA學(xué)歷對員工升遷的作用,而這個對你的個人發(fā)展很重要,因為你要決定接下來是不是去讀一個MBA學(xué)位。由于新來,壓根沒有樣本,這時候你可以采用貝葉斯定理。 P(A) 是你根據(jù)過往經(jīng)驗事先估計的,MBA對升遷有多大好處? 比如你先預(yù)估一個30%。這時候,出現(xiàn)了一個新信息B,小王升遷了,而且小王是MBA。 那么,P(B|A) 是說當MBA管用時,小王升遷的概率,比如你現(xiàn)在的判斷是80%。小王可能本身就有能力且業(yè)績突出,就算沒有MBA也可能會升遷啊,所以P(B|A_) = 50%。(發(fā)現(xiàn)了嗎,這個公式自動的幫助我們避免走極端) 套入貝葉斯公式,P(A|B) = 30% * 80% / (80% * 30% + 50% * 70%) = 41%。從30%提高到了41%。那么當小王升遷這個新情況出現(xiàn)以后,你對MBA作用的概率判斷從30%提高到了41%。 但是,過了段時間,你發(fā)現(xiàn)同樣是MBA的小李,熬了很多年也沒有升遷,最后辭職了?,F(xiàn)在你對小李因為MBA有效而升遷的概率判斷降為20%了。 套入公式,新的P(A|B) = 41% * 20% / (20%*41% + 50%*59%) = 22%。從剛才的41%跌了近一半。 這樣幾次下來,你就能對這個這家公司對MBA的看法有個相對靠譜的判斷了。 或許你會說,搞這么復(fù)雜干嘛,有了新情況,我原來的看法會改變,新情況和自己的預(yù)期一致就強化原來的看法,否則就弱化,這不就是常識嗎,還用得著什么數(shù)學(xué)定理嗎? 很好,的確一針見血。
拉普拉斯說過,所謂的概率就是把人們的常識用數(shù)學(xué)表達出來。也有人說,人腦就是采用貝葉斯方法來工作的。 但是我們?nèi)四X有偏差啊,有誤區(qū)啊,會犯渾啊,這個公式讓我們忽然獲得了一個上帝視角,來審視我們自己究竟是怎么做判斷,做決定的,計算機又是怎么模仿并超越我們的,這豈不是很美妙的一件事情 。 |
|
|
來自: 鋼鐵張 > 《心理學(xué)》