M1 統計學:條件概率與貝葉斯定理
大家好!歡迎來到統計學中最有趣課題之一——條件概率與貝葉斯定理的學習筆記。這些名字聽起來可能有點嚇人,但請別擔心!這些概念其實非常合乎邏輯,而且應用無處不在,從天氣預報到醫學診斷,甚至你在 Netflix 上的推薦內容都有它們的蹤影!
在本章中,我們將學習如何回答類似「如果天空多雲,今天下雨的概率是多少?」這類問題。我們會將所有內容拆解成簡單易懂的步驟。準備好開始了嗎?
1. 什麼是條件概率?
條件概率的核心概念是:在另一個事件已經發生的前提下,某事件發生的概率。我們基本上是根據新資訊來更新概率。
快速回顧:基本概率
還記得事件 A 的基本概率是:
$$P(A) = \frac{\text{Number of favourable outcomes for A}}{\text{Total number of possible outcomes}}$$例子:擲標準六面骰子擲出「4」的概率是 $$P(\text{rolling a 4}) = \frac{1}{6}$$,因為只有一個「4」,而總共有六個面。
核心思想:一個縮小的「宇宙」
條件概率只是縮小我們的「宇宙」(官方術語是樣本空間)。當我們知道某個事件已經發生時,我們可以忽略所有不再可能發生的其他結果。
類比:在學校裡尋找特定學生。
想像一下,你的學校有1000名學生。隨機選出一名中六女生的概率是 $$P(\text{Form 6 Girl})$$。
現在,如果我給你一些新資訊:「我已經選了一名中六學生。」
突然間,你可以忽略所有中一到中五的學生了!你的樣本空間從1000名學生縮小到只剩下中六學生。在學生是中六生的前提下,選到女生的概率將會不同,而且很可能會更高。
符號表示與公式
我們將「在事件B已發生的前提下事件A發生」的條件概率寫作 P(A|B)。
小小的垂直線「|」代表「在...前提下」或「給定」。所以,你將 P(A|B) 讀作「在B的前提下A的概率」。
連接所有概念的公式是:
$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$讓我們分解一下:
P(A|B):這是我們想找的——在B的前提下A的概率。
$$P(A \cap B)$$:這是A和B同時發生的概率(A和B的交集)。
P(B):這是「給定」事件B的概率。這就是我們新的、縮小的樣本空間!
記憶小貼士:
公式可以這樣記:「你想要的事件(A)在給定條件(B)下的概率,就是兩件事同時發生的概率,除以給定條件的概率。」
利用表格的逐步例子
一組100名學生被問及他們是否打籃球或足球。結果如下表所示。
打足球 | 不打足球 | 總計 | |
---|---|---|---|
打籃球 | 20 | 25 | 45 |
不打籃球 | 30 | 25 | 55 |
總計 | 50 | 50 | 100 |
問題:在學生打足球的前提下,他/她打籃球的概率是多少?
步驟1:定義事件。
設 B = 學生打籃球。
設 F = 學生打足球。
我們想找出 P(B|F)。
步驟2:從表格找出概率。
首先,找出交集的概率 $$P(B \cap F)$$。這是學生同時打籃球和足球的概率。
從表格可見,有20名學生兩者都打。所以,$$P(B \cap F) = \frac{20}{100} = 0.2$$
接下來,找出「給定」事件的概率 P(F)。這是學生打足球的概率。
從表格可見,有50名學生打足球。所以,$$P(F) = \frac{50}{100} = 0.5$$
步驟3:應用公式。
$$P(B|F) = \frac{P(B \cap F)}{P(F)} = \frac{0.2}{0.5} = 0.4$$因此,在學生打足球的前提下,他/她打籃球的概率是0.4。
另一種更簡單的思考方式(利用縮小後的樣本空間):
問題告訴我們學生「打足球」。所以我們可以完全忽略那50名不打足球的學生。我們新的「總數」就只剩下那50名足球運動員。
在這50名足球運動員中,有多少人同時打籃球呢?表格顯示有20人。
所以,概率就是簡單的 $$\frac{20}{50} = 0.4$$。答案一樣!
常見錯誤:
• 不要混淆 P(A|B) 和 P(B|A)。它們通常是不同的!(例如,在你是女生的前提下,你是中六學生的概率,與在你是中六學生的前提下,你是女生的概率,兩者是不同的。)
• 分母永遠是「給定」事件的概率。對於 P(A|B),分母是 P(B)。
重點:
條件概率就是在一個較小的「世界」裡的概率。公式 $$P(A|B) = \frac{P(A \cap B)}{P(B)}$$ 是你的主要工具,但請務必嘗試思考縮小後的樣本空間,以建立你的直覺。
2. 乘法定律與樹形圖
有時我們需要找出兩個事件按順序發生的概率。我們可以重新整理條件概率公式來幫助我們。
一般乘法定律
從 $$P(A|B) = \frac{P(A \cap B)}{P(B)}$$ 出發,如果我們將兩邊乘以 P(B),我們會得到:
$$P(A \cap B) = P(B) \times P(A|B)$$這告訴我們A和B同時發生的概率是B發生的概率,乘以在B已經發生後A發生的概率。這對於涉及「不放回」的題目非常有用。
用樹形圖可視化
樹形圖是解決條件概率問題的最佳拍檔。它們幫助你清晰地組織所有資訊。
例子:一個袋子裡有5個紅球和3個藍球。你從袋中連續抽取兩個球,不放回。兩個球都是紅色的概率是多少?
步驟1:畫出第一次抽取的樹形分支。
球的總數 = 8。
第一次抽出紅球的概率,$$P(R_1) = \frac{5}{8}$$
第一次抽出藍球的概率,$$P(B_1) = \frac{3}{8}$$
步驟2:畫出第二組分支,並使它們具備條件性。
如果第一個球是紅色:現在只剩下7個球(4紅,3藍)。
• 在第一個球是紅色的前提下,第二個球是紅色的概率是 $$P(R_2 | R_1) = \frac{4}{7}$$
• 在第一個球是紅色的前提下,第二個球是藍色的概率是 $$P(B_2 | R_1) = \frac{3}{7}$$
如果第一個球是藍色:現在只剩下7個球(5紅,2藍)。
• 在第一個球是藍色的前提下,第二個球是紅色的概率是 $$P(R_2 | B_1) = \frac{5}{7}$$
• 在第一個球是藍色的前提下,第二個球是藍色的概率是 $$P(B_2 | B_1) = \frac{2}{7}$$
步驟3:沿著分支相乘,找出路徑的概率。
我們想找出「第一個是紅色 AND 第二個是紅色」的概率,即 $$P(R_1 \cap R_2)$$。
使用乘法定律:
(樹形圖會直觀地顯示這條路徑!)
重點:
對於順序發生的事件,使用乘法定律 $$P(A \cap B) = P(A) \times P(B|A)$$。有疑問時,就畫樹形圖!它能讓複雜的問題變得清晰得多。
3. 貝葉斯定理:反轉條件
這是重頭戲!它看起來很複雜,但其理念很簡單。貝葉斯定理幫助我們「反轉」條件概率。通常,我們知道 P(B|A),但我們真正想找出的是 P(A|B)。
「為何如此」:醫療檢測的類比
想像一下,有一個罕見疾病的醫療檢測。
- 我們可能知道檢測的準確性:在患有疾病的前提下,檢測結果呈陽性的概率。我們將其稱為 P(陽性 | 疾病)。
- 但患者在得到陽性結果後真正想知道的是什麼?他們想知道在檢測結果呈陽性的前提下,他們患有疾病的概率。這就是 P(疾病 | 陽性)。
注意條件是如何反轉的!貝葉斯定理就是讓我們計算這個的工具。
公式
貝葉斯定理的簡單版本直接源自乘法定律:
$$P(A|B) = \frac{P(B|A) \times P(A)}{P(B)}$$棘手的部分是我們通常不知道 P(B) 的直接數值。我們必須使用全概率定律來計算它。如果事件 A 可以發生或不發生(A'),那麼 B 的概率是:
$$P(B) = P(B|A)P(A) + P(B|A')P(A')$$將所有部分組合起來,我們得到了你在問題中將使用的完整版本:
$$P(A|B) = \frac{P(B|A)P(A)}{P(B|A)P(A) + P(B|A')P(A')}$$不要慌張!這個公式只是「你想要的路徑」除以「所有可能通向該結果的路徑之和」。樹形圖讓這一切變得超級容易理解。
貝葉斯定理的逐步解題方法
兩家工廠 A 和 B 生產燈泡。工廠 A 生產 60% 的燈泡,工廠 B 生產 40%。已知工廠 A 生產的燈泡有 2% 是有缺陷的,工廠 B 生產的燈泡有 5% 是有缺陷的。
問題:如果你隨機選擇一個燈泡,發現它有缺陷,那麼這個燈泡來自工廠 A 的概率是多少?
步驟1:定義事件。
A = 燈泡來自工廠 A。
B = 燈泡來自工廠 B。
D = 燈泡有缺陷。
我們想找出 P(A|D) ——在燈泡有缺陷的前提下,它來自工廠 A 的概率。
步驟2:列出已知概率(樹形圖在這裡非常適用!)。
• P(A) = 0.60 (工廠 A 生產 60%)
• P(B) = 0.40 (工廠 B 生產 40%)
現在是條件概率:
• P(D|A) = 0.02 (在來自 A 的前提下,有缺陷的概率)
• P(D'|A) = 0.98 (在來自 A 的前提下,沒有缺陷的概率)
• P(D|B) = 0.05 (在來自 B 的前提下,有缺陷的概率)
• P(D'|B) = 0.95 (在來自 B 的前提下,沒有缺陷的概率)
步驟3:找出分子中「你想要的路徑」。
我們想找出 P(A|D)。代表「來自 A AND 有缺陷」的路徑是 $$P(D|A)P(A)$$。
$$P(D|A)P(A) = (0.02) \times (0.60) = 0.012$$
步驟4:找出分母中結果的總概率。
結果是「有缺陷」(D)。燈泡有缺陷有兩種情況:
1. 來自工廠 A 且有缺陷:$$P(D|A)P(A) = 0.012$$
2. 來自工廠 B 且有缺陷:$$P(D|B)P(B) = (0.05) \times (0.40) = 0.020$$
有缺陷的總概率 P(D),是這些路徑的總和:
$$P(D) = 0.012 + 0.020 = 0.032$$
步驟5:計算最終答案。
$$P(A|D) = \frac{\text{Path you want}}{\text{Sum of all paths to outcome}} = \frac{P(D|A)P(A)}{P(D)}$$ $$P(A|D) = \frac{0.012}{0.032} = 0.375$$所以,即使工廠 A 生產了更多的燈泡,如果你發現一個有缺陷的燈泡,它來自工廠 A 的機會只有 37.5%。這是因為工廠 B 的缺陷率更高。
重點:
貝葉斯定理幫助我們根據新證據更新我們的信念。它反轉了條件。公式可能看起來很嚇人,但有了樹形圖,它就只是:
(導致你得到該結果的特定路徑的概率) / (所有可能導致你得到該結果的路徑的概率總和)。
章節總結:快速回顧
條件概率
- 是什麼:在B已經發生的前提下,A發生的概率。
- 符號:P(A|B)
- 公式:$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$
乘法定律
- 是什麼:幫助找出連續事件發生的概率。
- 公式:$$P(A \cap B) = P(A) \times P(B|A)$$
- 最佳工具:樹形圖!
貝葉斯定理
- 作用:「反轉」條件(當你知道 P(B|A) 時,找出 P(A|B))。
- 公式:$$P(A|B) = \frac{P(B|A)P(A)}{P(B)}$$
- 解題小貼士:永遠定義你的事件,列出已知量,並使用樹形圖。答案永遠是「(你所要的路徑) / (所有可能路徑的總和)」。
你一定做得到!練習是關鍵,所以多做一些題目,並盡可能畫樹形圖。祝你好運!