|
我必須等多長時(shí)間才能上車? 誰不知道這種感覺:您步行去公交車站,等公共汽車,然后…等。 然后您再等一會。 還有更多。 有人告訴您,巴士平均每10分鐘一班。 現(xiàn)在您已經(jīng)等了10分鐘。 公共汽車現(xiàn)在不應(yīng)該到嗎? 還有一個(gè)更緊迫的問題:您要等待多長時(shí)間? 答案是:持續(xù)10分鐘。 如果您假設(shè)任意兩輛公交車到來之間的時(shí)間都呈指數(shù)分布,則需要10分鐘。 這是矛盾的,令人驚訝,但這是事實(shí)。 它被稱為等待悖論。 這是我最喜歡的數(shù)學(xué)悖論之一。 我非常喜歡它,以至于在我們在公交車站等車的時(shí)候,有時(shí)我會隨機(jī)地把它告訴隨機(jī)的陌生人。 他們通常認(rèn)為我瘋了。 沒關(guān)系。 要了解等待悖論,我們首先需要了解概率分布。 什么是概率分布? (連續(xù))概率分布隨機(jī)變量是一個(gè)變量,其值不是確定性的,而是取決于隨機(jī)性。 概率分布是描述此類隨機(jī)變量X的所有可能值以及該變量可能采用的這些值的概率的函數(shù)。 我們通??梢詫⒏怕史植挤譃閮深悾?/p>
離散意味著我們的隨機(jī)變量只能采用有限多個(gè)或至少可計(jì)數(shù)的無限多個(gè)值。 在連續(xù)的情況下,隨機(jī)變量可以取無數(shù)個(gè)無限數(shù)量的值。 在大多數(shù)情況下,這基本上意味著離散隨機(jī)變量采用的數(shù)字為1、2、3…,而連續(xù)隨機(jī)變量可以為任何實(shí)數(shù)。 離散隨機(jī)變量的一個(gè)很好的例子是投幣或擲骰子,人口規(guī)模等。 連續(xù)隨機(jī)變量的一個(gè)很好的例子是距離,身體高度,體重等等-基本上,任何可能是任何實(shí)數(shù)值或?qū)崝?shù)子集的東西。 在這個(gè)故事中,我們將只討論連續(xù)概率分布。 可以使用累積概率分布函數(shù)(通常用F(x)表示)來描述(連續(xù))概率分布。 如果F(x)是可微的,即存在該函數(shù)F(x)的導(dǎo)數(shù),則該導(dǎo)數(shù)稱為概率密度函數(shù),并用f(x)表示。 旁注:實(shí)際上,F(xiàn)(x)幾乎在任何地方都需要可微,但是對于我們將使用的示例,我們可以說F(x)需要可微,而f(x)是F的導(dǎo)數(shù) (X)。 累積分布函數(shù)(cdf F(x)) 隨機(jī)變量X(也稱為cdf)的累積概率分布函數(shù)F(x)= P(X≤x)主要具有兩個(gè)屬性:
Some examples of cdfs for three very popular probability distributions. 概率密度函數(shù)(pdf f(x)) 概率密度函數(shù)f(x),也稱為pdf,主要具有兩個(gè)屬性:
Some examples of pdfs for three very popular probability distributions. 概率分布的pdf不一定存在,而cdf總是存在,即使我們可能不總是能夠使用已知的標(biāo)準(zhǔn)函數(shù)將其寫下來。 一個(gè)很好的例子就是正態(tài)分布,人們通常會知道著名的鐘形曲線,即它的pdf,但是對于cdf,我們通常只寫pdf的積分而不是明確地寫它。 如果pdf存在,我們可以用它來計(jì)算隨機(jī)變量X的期望值。 期望值E(X) 連續(xù)隨機(jī)變量X的期望值E(X)然后由 期望值的解釋是什么? 好吧,這個(gè)名稱有點(diǎn)讓人誤解,因?yàn)樗皇悄谕闹担侨绻覀儍H經(jīng)常重復(fù)進(jìn)行一次實(shí)驗(yàn),隨機(jī)變量將取的平均值! 實(shí)際上,我們可能永遠(yuǎn)也觀察不到期望值。 讓我舉一個(gè)例子來理解這一點(diǎn)。 假設(shè)我們進(jìn)行了一個(gè)(離散的)實(shí)驗(yàn),其期望值為0.5,即1000次。 如果我們將所有觀測值相加并除以1000,它將非常接近我們的期望值0.5。 這是由于一個(gè)定理稱為大數(shù)定律。 例如,假設(shè)您扔了一枚硬幣1000次。 如果獲得正面評價(jià),您將獲得1分。 如果是反面,您將獲得0分。 隨機(jī)變量X描述了您扔硬幣一次時(shí)獲得的分?jǐn)?shù)。 如果它是一個(gè)公平的硬幣,它的期望值是 E(X)= 0.5 * 1 + 0.5 * 0 = 0.5, 使用期望值的真實(shí)定義來計(jì)算。 另外,在將硬幣投入1000次之后,您應(yīng)該在獲得1000次投入后獲得500點(diǎn)積分,因此期望值將為500/1000 = 0.5,但這是我們在拋硬幣時(shí)永遠(yuǎn)無法達(dá)到的值! 指數(shù)分布讓我們看一下指數(shù)分布。 這是我最喜歡的概率分布。 為什么? 因?yàn)樗唵?,美觀且充滿驚喜。 參數(shù)λ> 0的指數(shù)分布的cdf由下式給出 pdf由 然后我們可以通過
我們還可以為幾個(gè)不同的參數(shù)λ(例如,對于λ= 0.3,λ= 1和λ= 3)繪制pdf,以了解其行為。 等待的悖論現(xiàn)在讓我們回到等待悖論。 我們假設(shè)任何兩個(gè)到達(dá)之間的時(shí)間是獨(dú)立的,并且以λ= 0.1分鐘呈指數(shù)分布。 這意味著兩次到達(dá)之間的預(yù)期時(shí)間為 E(X)= 1 /λ= 1 / 0.1 = 10 分鐘或平均每10分鐘一班。 令X為描述兩次到達(dá)之間時(shí)間的隨機(jī)變量。 現(xiàn)在,我們說,自從最后一班車到達(dá)以來已經(jīng)過了幾分鐘。 我們必須再等待t分鐘的概率是多少,即兩次到達(dá)之間的時(shí)間為s + t或以數(shù)學(xué)術(shù)語表示的概率是多少? P(X> s + t | X> s)? 好吧,我們可以計(jì)算一下。 答案是,就像我們從未等待過而必須等待t分鐘一樣,即P(X> t)。
起初這很矛盾,令人驚訝! 這個(gè)屬性也是為什么無論我們什么時(shí)候到達(dá)公交車站,如果公共汽車平均每10分鐘一班,我們?nèi)匀徊坏貌辉俚仁昼姡ㄖ辽倨骄?為了使這一點(diǎn)更加明顯,我們還可以在X大于s的情況下計(jì)算X的條件期望值,即在已經(jīng)等待s分鐘的情況下計(jì)算期望的總等待時(shí)間。 然后舉行 E(X | X> s)= E(X)+ s。 再次,解釋是相同的,無論我們已經(jīng)等待了多少時(shí)間,我們?nèi)匀挥型俚却? /λ分鐘。 計(jì)算起來有些棘手,所以可以跳過這一部分(如果您有興趣,可以放縱一下)。 我們要計(jì)算 其中帶有雙線的1是所謂的指標(biāo)函數(shù)。 為此,我們首先計(jì)算提名者。
然后我們得到期望的結(jié)果
就是如此 為什么Waiting-Paradox僅適用于指數(shù)分布?由于矩陣呈指數(shù)分布,因此'等待悖論'起作用。 實(shí)際上,指數(shù)分布是唯一適用的連續(xù)分布。 對于所有其他發(fā)行版,它將不起作用。 有一個(gè)直觀的解釋。 使用指數(shù)分布,任意兩個(gè)到達(dá)之間的時(shí)間不是均勻分布,而是指數(shù)分布。 這意味著有時(shí)兩次到達(dá)之間的時(shí)間可能很大,但通常會非常小。
因此,更有可能我們陷入了漫長的等待期而不是短暫的等待期。 例如,如果我們生活在一個(gè)理想的世界中,公交車每10分鐘到達(dá)一次(即不再有隨機(jī)性),而我們到達(dá)的時(shí)間是隨機(jī)的,即在最后一輛公交車到達(dá)后的0到10分鐘之間均勻分布,那么我們 平均會等待5分鐘。
Pdf of the uniform distribution between 0 and 10 with expected value of 5. 這是因?yàn)槿我鈨蓚€(gè)到達(dá)點(diǎn)之間的距離均勻。 如果我們隨機(jī)地到達(dá)公交車站,那么趕上一個(gè)很大的等待間隙的機(jī)會就會相對較小。 而且,與指數(shù)分布相比,兩輛公交車緊挨著到達(dá)的機(jī)會要小得多。 但是,等等,現(xiàn)實(shí)生活如何?這是數(shù)學(xué),誰在乎現(xiàn)實(shí)生活中真正發(fā)生的事情? 好吧,我只是在開玩笑。 當(dāng)然,當(dāng)公共汽車按時(shí)間表到達(dá)(或多或少)時(shí),我們當(dāng)然不能假設(shè)兩次到達(dá)之間的時(shí)間呈指數(shù)分布。 在理想的情況下,公交車可以按計(jì)劃到達(dá)。 但是,在我的故鄉(xiāng)柏林,假設(shè)指數(shù)分布可能并不遙遠(yuǎn)。 因?yàn)橛袝r(shí)我到達(dá)公交車站,所以我等了10分鐘。 然后,同一條線上的三輛公交車緊接著又到達(dá)。 這些時(shí)刻使我相信,在對這個(gè)問題建模時(shí),指數(shù)分布可能不是最差的選擇。 下次您等在公共汽車站等閑聊時(shí),這里有個(gè)故事要講。 (本文翻譯自Maike Elisa的文章《The Waiting Paradox: An Intro to Probability Distributions》,參考:https:///cantors-paradise/the-waiting-paradox-an-intro-to-probability-distributions-97c0aedb8c1) |
|
|