|
2022年高考數(shù)學(xué)全國卷I的下面這道概率題,相關(guān)知識掌握了,解起來就特別容易。如果相關(guān)知識沒有掌握,就幾乎沒有辦法解決。不過就算能夠輕易解決,想真正理解題目的數(shù)學(xué)內(nèi)涵,還真不容易呢。 一醫(yī)療團隊為研究某地的一種地方性疾病與當(dāng)?shù)鼐用竦男l(wèi)生習(xí)慣(衛(wèi)生習(xí)慣分為良好和不夠良好兩類)的關(guān)系,在已患該疾病的病例中隨機調(diào)查了100例(稱為病例組),同時在未患該疾病的人群中隨機調(diào)查了100人(稱為對照組),得到如下數(shù)據(jù):
(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣有差異? (2)從該地的人群中任選一人,A表示事件“選到的人衛(wèi)生慣不夠良好”?B表示事件“選到的人有該疾病”,P(B|A)/P(B逆|A)與P(B|A逆)/P(B逆|A逆)的比值是衛(wèi)生習(xí)慣不夠良好對患該疾病風(fēng)險程度的一項度量指標,記該指標為R. (I)證明: R=(P(A|B)/P(A逆|B))·(P(A逆|A逆)/P(A|B逆)); (II)利用該調(diào)查數(shù)據(jù),給出P(A|B), P(A|B逆)的估計值,并利用(I)的結(jié)果給出R的估計值. 附:K^2=n(ad-bc)^2/((a+b)(c+d)(a+c)(b+d)),
這次老黃先給解題過程,再來深挖問題中有趣的東西。 (1)解:K^2=200×(40×90-60×10)^2/((40+60)(10+90)(40+10)(60+90))=24>10.828,【注意a是主表中第一個數(shù)據(jù),a,d必須在對角線上,b,c也必須在對角線上】 ∴有99%的把握認為患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣有差異. 【對照附表中,10.828以上表示的,不僅有99%的把握,甚至有99.9%以上的把握,簡直可以說是絕對的了】 (2)(I)證明:P(B|A)=a/(a+c), P(B逆|A)=c/(a+c); P(B|A逆)=b/(b+d), P(B逆|A逆)=d/(b+d), R=(P(B|A)/P(B逆|A))/(P(B|A逆)/P(B逆|A逆))=(a/c)/(b/d)=ad/(bc). 又P(A|B)=a/(a+b), P(A逆|B)=b/(a+b); P(A逆|B逆)=d/(c+d), P(A|B逆)=c/(c+d); ∴(P(A|B)/P(A逆|B))·(P(A逆|B逆)/P(A|B逆))=(a/b)·(d/c)=ad/(bc)=R, 得證! 【第二個小題的第一個問題,肯定有人直接把各個概率都求出來,然后比較大小,從而得證。那樣也未嘗不可,因為那樣做的話,連第二個問題的答案也都求出來了】 (II)解: P(A|B)=40%, P(A|B逆)=10%. R=(40%/60%)×(90%/10%)=6. 【或R=40×90/(60×10)=6. 用了第一個問中求R的兩個不同公式】 這道題想解決容易,想要理解就難了!它可能涉及到大學(xué)統(tǒng)計學(xué)的知識,偏偏這正是老黃當(dāng)年讀書的最弱項。不過老黃是一個不輕言放棄的人,老黃決定用自己的方式進行理解,不懂的小伙伴不要被老黃誤導(dǎo),懂的朋友歡迎討論批評。要知道知識多數(shù)是從討論之中得到的! 首先,明確K^2的意義。它是對事件獨立性的檢驗,誰的獨立性?就是“患病概率”和“衛(wèi)生習(xí)慣”之間的獨立性。數(shù)值越小,獨立性越強,相關(guān)性越弱;數(shù)值越大,獨立性越弱,相關(guān)性越強。所以您要是想把它叫做“事件相關(guān)性檢驗”,老黃看也行! 至于這個K^2是怎么來的,那就說來話長了,其實老黃也不知道。只是感覺分子中的ad表示“沒有衛(wèi)生習(xí)慣就犯病”和“有衛(wèi)生習(xí)慣就不犯病”這兩件事情給相關(guān)起來了,而bc則表示“有衛(wèi)生習(xí)慣就犯病”和“沒有衛(wèi)生習(xí)慣就不犯病”這兩件事情給相關(guān)起來了,這不扯犢子嗎?因此用ad減去bc,想必很好理解了吧。 分母a+b表示犯病的病例組樣本總數(shù),c+d表示對照組不犯病的樣本總數(shù),a+c表示有衛(wèi)生習(xí)慣的總數(shù),b+d表示沒有衛(wèi)生習(xí)慣的總數(shù)。這明顯就是沒有衛(wèi)生習(xí)慣的犯病相關(guān)性乘以有衛(wèi)生習(xí)慣與不犯病的相關(guān)性,表示整個研究對象和研究事件總體的相關(guān)性。 這么一理解,就可以看出,分子比分母表示的是正相關(guān)在總相關(guān)性中所占的比例。再乘以兩個樣本的總量,就能得到事件的相關(guān)性了。 您看老黃扯得合不合理。雖然老黃是瞎扯的,不過老黃有很多知識,都是通過這么瞎扯來的。接下來,老黃只要在實踐中慢慢檢驗自己的猜想,并與相關(guān)知識做比較,校正老黃的認知,就能把這個知識理解得比一般人深刻了。 其實老黃這里講的是一種學(xué)習(xí)的方法,不知道您看出來了沒有。 現(xiàn)在老黃要分析第(2)小題中的“R”到底是個什么玩意。 其中,P(B|A)表示不講究衛(wèi)生得病的概率;P(B逆|A)表示不講究衛(wèi)生不得病的概率。它們的比值,就是不講究衛(wèi)生的情況下,得病和不得病的概率比;P(B|A逆)則表示講究衛(wèi)生得病的概率;P(B逆|A逆)表示講究衛(wèi)生不得病的概率。它們的比表示講究衛(wèi)生的情況下,得病和不得病的概率比。兩個概率比的商,化成積的形式,就變成了,“不講究衛(wèi)生的情況下,得病和不得病的概率比”與“講究衛(wèi)生的情況下,不得病和得病的概率比”的積。這是啥玩意? 我們假設(shè)一下,這兩個概率比正好是互為倒數(shù)的,那么它們的積的結(jié)果正好等于1. 說明得不得病,和講不講究衛(wèi)生,根本沒有什么關(guān)系。但如果前者變大,就說明不講究衛(wèi)生得病的概率更高;后者變大,則表示講究衛(wèi)生不得病的概率更高。兩個同時變大,就得到“不講究衛(wèi)生得病的概率變大;講究衛(wèi)生不得病的概率變大”的結(jié)論。即R越大,兩者相關(guān)性越強。反之就扯蛋了。如果得到“不講究衛(wèi)生不得病的概率變大;講究衛(wèi)生得病的概率變大”,就不合理了。 最后來看(2)(I)中要證明相等的另一個表達式的含義,看看和上面分析的R的含義是否相同。 首先,P(A|B)表示生病的人不講衛(wèi)生的概率;P(A逆|B)表示生病的人講衛(wèi)生的概率。它們的比值,就是在生病的情況下,不講衛(wèi)生和講衛(wèi)生的概率比。另一方面,P(A逆|B逆)表示不生病的人講衛(wèi)生的概率;P(A|B逆)表示不生病的人不講衛(wèi)生的概率。它們的比值,就是在不生病的情況下,講衛(wèi)生還是不講衛(wèi)生的概率比。兩個概率比的積是“生病的情況下,是不講衛(wèi)生還是講衛(wèi)生的概率比”與“不生病的情況下,是講衛(wèi)生還是不衛(wèi)生的概率比”的積。這又是個啥玩意呢? 假如兩個概率比正好互為倒數(shù),那么它們的積的結(jié)果正好等于1. 說明講不講衛(wèi)生,根本不會影響到生不生病的問題。但如果前者變大,就得到“生病的人不講衛(wèi)生的概率更大”;如果后者變大,就得到“不生病的人講衛(wèi)生的概率更大”。兩個同時變大,就得到“生病的人不講衛(wèi)生概率變大;不生病的人講衛(wèi)生的概率變大”的結(jié)論。即R越大,兩者相關(guān)性越強。反之就扯蛋了。如果得到“得病講究衛(wèi)生概率更大;不得病不講究衛(wèi)生概率更大”,就不合理了。 兩相一比較,它們講的不就是同一回事嗎?所以第(2)小題的證明題得證??梢娎宵S也不是純瞎扯的哦。 所以說,這道題想解決容易,想理解難,您怎么看呢? |
|
|