M1 統計學:條件概率與貝葉斯定理

大家好!歡迎來到統計學中最有趣課題之一——條件概率與貝葉斯定理的學習筆記。這些名字聽起來可能有點嚇人,但請別擔心!這些概念其實非常合乎邏輯,而且應用無處不在,從天氣預報到醫學診斷,甚至你在 Netflix 上的推薦內容都有它們的蹤影!

在本章中,我們將學習如何回答類似「如果天空多雲,今天下雨的概率是多少?」這類問題。我們會將所有內容拆解成簡單易懂的步驟。準備好開始了嗎?


1. 什麼是條件概率?

條件概率的核心概念是:在另一個事件已經發生的前提下,某事件發生的概率。我們基本上是根據新資訊來更新概率。

快速回顧:基本概率

還記得事件 A 的基本概率是:

$$P(A) = \frac{\text{Number of favourable outcomes for A}}{\text{Total number of possible outcomes}}$$

例子:擲標準六面骰子擲出「4」的概率是 $$P(\text{rolling a 4}) = \frac{1}{6}$$,因為只有一個「4」,而總共有六個面。

核心思想:一個縮小的「宇宙」

條件概率只是縮小我們的「宇宙」(官方術語是樣本空間)。當我們知道某個事件已經發生時,我們可以忽略所有不再可能發生的其他結果。

類比:在學校裡尋找特定學生。
想像一下,你的學校有1000名學生。隨機選出一名中六女生的概率是 $$P(\text{Form 6 Girl})$$。
現在,如果我給你一些新資訊:「我已經選了一名中六學生。」
突然間,你可以忽略所有中一到中五的學生了!你的樣本空間從1000名學生縮小到只剩下中六學生。在學生是中六生的前提下,選到女生的概率將會不同,而且很可能會更高。

符號表示與公式

我們將「在事件B已發生的前提下事件A發生」的條件概率寫作 P(A|B)

小小的垂直線「|」代表「在...前提下」或「給定」。所以,你將 P(A|B) 讀作「在B的前提下A的概率」。

連接所有概念的公式是:

$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$

讓我們分解一下:

  • P(A|B):這是我們想找的——在B的前提下A的概率。

  • $$P(A \cap B)$$:這是A和B同時發生的概率(A和B的交集)。

  • P(B):這是「給定」事件B的概率。這就是我們新的、縮小的樣本空間!

記憶小貼士:

公式可以這樣記:「你想要的事件(A)在給定條件(B)下的概率,就是兩件事同時發生的概率,除以給定條件的概率。」

利用表格的逐步例子

一組100名學生被問及他們是否打籃球或足球。結果如下表所示。

打足球 不打足球 總計
打籃球 20 25 45
不打籃球 30 25 55
總計 50 50 100

問題:在學生打足球的前提下,他/她打籃球的概率是多少?

步驟1:定義事件。

設 B = 學生打籃球。
設 F = 學生打足球。

我們想找出 P(B|F)。

步驟2:從表格找出概率。

首先,找出交集的概率 $$P(B \cap F)$$。這是學生同時打籃球和足球的概率。
從表格可見,有20名學生兩者都打。所以,$$P(B \cap F) = \frac{20}{100} = 0.2$$

接下來,找出「給定」事件的概率 P(F)。這是學生打足球的概率。
從表格可見,有50名學生打足球。所以,$$P(F) = \frac{50}{100} = 0.5$$

步驟3:應用公式。

$$P(B|F) = \frac{P(B \cap F)}{P(F)} = \frac{0.2}{0.5} = 0.4$$

因此,在學生打足球的前提下,他/她打籃球的概率是0.4。

另一種更簡單的思考方式(利用縮小後的樣本空間):

問題告訴我們學生「打足球」。所以我們可以完全忽略那50名不打足球的學生。我們新的「總數」就只剩下那50名足球運動員。
在這50名足球運動員中,有多少人同時打籃球呢?表格顯示有20人。
所以,概率就是簡單的 $$\frac{20}{50} = 0.4$$。答案一樣!

常見錯誤:

• 不要混淆 P(A|B) 和 P(B|A)。它們通常是不同的!(例如,在你是女生的前提下,你是中六學生的概率,與在你是中六學生的前提下,你是女生的概率,兩者是不同的。)
• 分母永遠是「給定」事件的概率。對於 P(A|B),分母是 P(B)。

重點:

條件概率就是在一個較小的「世界」裡的概率。公式 $$P(A|B) = \frac{P(A \cap B)}{P(B)}$$ 是你的主要工具,但請務必嘗試思考縮小後的樣本空間,以建立你的直覺。


2. 乘法定律與樹形圖

有時我們需要找出兩個事件按順序發生的概率。我們可以重新整理條件概率公式來幫助我們。

一般乘法定律

從 $$P(A|B) = \frac{P(A \cap B)}{P(B)}$$ 出發,如果我們將兩邊乘以 P(B),我們會得到:

$$P(A \cap B) = P(B) \times P(A|B)$$

這告訴我們A和B同時發生的概率是B發生的概率,乘以在B已經發生後A發生的概率。這對於涉及「不放回」的題目非常有用。

用樹形圖可視化

樹形圖是解決條件概率問題的最佳拍檔。它們幫助你清晰地組織所有資訊。

例子:一個袋子裡有5個紅球和3個藍球。你從袋中連續抽取兩個球,不放回。兩個球都是紅色的概率是多少?

步驟1:畫出第一次抽取的樹形分支。

球的總數 = 8。
第一次抽出紅球的概率,$$P(R_1) = \frac{5}{8}$$
第一次抽出藍球的概率,$$P(B_1) = \frac{3}{8}$$

步驟2:畫出第二組分支,並使它們具備條件性。

如果第一個球是紅色:現在只剩下7個球(4紅,3藍)。
• 在第一個球是紅色的前提下,第二個球是紅色的概率是 $$P(R_2 | R_1) = \frac{4}{7}$$
• 在第一個球是紅色的前提下,第二個球是藍色的概率是 $$P(B_2 | R_1) = \frac{3}{7}$$

如果第一個球是藍色:現在只剩下7個球(5紅,2藍)。
• 在第一個球是藍色的前提下,第二個球是紅色的概率是 $$P(R_2 | B_1) = \frac{5}{7}$$
• 在第一個球是藍色的前提下,第二個球是藍色的概率是 $$P(B_2 | B_1) = \frac{2}{7}$$

步驟3:沿著分支相乘,找出路徑的概率。

我們想找出「第一個是紅色 AND 第二個是紅色」的概率,即 $$P(R_1 \cap R_2)$$。
使用乘法定律:

$$P(R_1 \cap R_2) = P(R_1) \times P(R_2|R_1) = \frac{5}{8} \times \frac{4}{7} = \frac{20}{56} = \frac{5}{14}$$

(樹形圖會直觀地顯示這條路徑!)

重點:

對於順序發生的事件,使用乘法定律 $$P(A \cap B) = P(A) \times P(B|A)$$。有疑問時,就畫樹形圖!它能讓複雜的問題變得清晰得多。


3. 貝葉斯定理:反轉條件

這是重頭戲!它看起來很複雜,但其理念很簡單。貝葉斯定理幫助我們「反轉」條件概率。通常,我們知道 P(B|A),但我們真正想找出的是 P(A|B)。

「為何如此」:醫療檢測的類比

想像一下,有一個罕見疾病的醫療檢測。

  • 我們可能知道檢測的準確性:在患有疾病的前提下,檢測結果呈陽性的概率。我們將其稱為 P(陽性 | 疾病)。
  • 但患者在得到陽性結果後真正想知道的是什麼?他們想知道在檢測結果呈陽性的前提下,他們患有疾病的概率。這就是 P(疾病 | 陽性)。

注意條件是如何反轉的!貝葉斯定理就是讓我們計算這個的工具。

公式

貝葉斯定理的簡單版本直接源自乘法定律:

$$P(A|B) = \frac{P(B|A) \times P(A)}{P(B)}$$

棘手的部分是我們通常不知道 P(B) 的直接數值。我們必須使用全概率定律來計算它。如果事件 A 可以發生或不發生(A'),那麼 B 的概率是:

$$P(B) = P(B|A)P(A) + P(B|A')P(A')$$

將所有部分組合起來,我們得到了你在問題中將使用的完整版本:

$$P(A|B) = \frac{P(B|A)P(A)}{P(B|A)P(A) + P(B|A')P(A')}$$

不要慌張!這個公式只是「你想要的路徑」除以「所有可能通向該結果的路徑之和」。樹形圖讓這一切變得超級容易理解。

貝葉斯定理的逐步解題方法

兩家工廠 A 和 B 生產燈泡。工廠 A 生產 60% 的燈泡,工廠 B 生產 40%。已知工廠 A 生產的燈泡有 2% 是有缺陷的,工廠 B 生產的燈泡有 5% 是有缺陷的。

問題:如果你隨機選擇一個燈泡,發現它有缺陷,那麼這個燈泡來自工廠 A 的概率是多少?

步驟1:定義事件。

A = 燈泡來自工廠 A。
B = 燈泡來自工廠 B。
D = 燈泡有缺陷。

我們想找出 P(A|D) ——在燈泡有缺陷的前提下,它來自工廠 A 的概率。

步驟2:列出已知概率(樹形圖在這裡非常適用!)。

• P(A) = 0.60 (工廠 A 生產 60%)
• P(B) = 0.40 (工廠 B 生產 40%)

現在是條件概率:

• P(D|A) = 0.02 (在來自 A 的前提下,有缺陷的概率)
• P(D'|A) = 0.98 (在來自 A 的前提下,沒有缺陷的概率)
• P(D|B) = 0.05 (在來自 B 的前提下,有缺陷的概率)
• P(D'|B) = 0.95 (在來自 B 的前提下,沒有缺陷的概率)

步驟3:找出分子中「你想要的路徑」。

我們想找出 P(A|D)。代表「來自 A AND 有缺陷」的路徑是 $$P(D|A)P(A)$$。
$$P(D|A)P(A) = (0.02) \times (0.60) = 0.012$$

步驟4:找出分母中結果的總概率。

結果是「有缺陷」(D)。燈泡有缺陷有兩種情況:
1. 來自工廠 A 且有缺陷:$$P(D|A)P(A) = 0.012$$
2. 來自工廠 B 且有缺陷:$$P(D|B)P(B) = (0.05) \times (0.40) = 0.020$$

有缺陷的總概率 P(D),是這些路徑的總和:
$$P(D) = 0.012 + 0.020 = 0.032$$

步驟5:計算最終答案。

$$P(A|D) = \frac{\text{Path you want}}{\text{Sum of all paths to outcome}} = \frac{P(D|A)P(A)}{P(D)}$$ $$P(A|D) = \frac{0.012}{0.032} = 0.375$$

所以,即使工廠 A 生產了更多的燈泡,如果你發現一個有缺陷的燈泡,它來自工廠 A 的機會只有 37.5%。這是因為工廠 B 的缺陷率更高。

重點:

貝葉斯定理幫助我們根據新證據更新我們的信念。它反轉了條件。公式可能看起來很嚇人,但有了樹形圖,它就只是:
(導致你得到該結果的特定路徑的概率) / (所有可能導致你得到該結果的路徑的概率總和)。


章節總結:快速回顧

條件概率
  • 是什麼:在B已經發生的前提下,A發生的概率。
  • 符號:P(A|B)
  • 公式:$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$
乘法定律
  • 是什麼:幫助找出連續事件發生的概率。
  • 公式:$$P(A \cap B) = P(A) \times P(B|A)$$
  • 最佳工具:樹形圖!
貝葉斯定理
  • 作用:「反轉」條件(當你知道 P(B|A) 時,找出 P(A|B))。
  • 公式:$$P(A|B) = \frac{P(B|A)P(A)}{P(B)}$$
  • 解題小貼士:永遠定義你的事件,列出已知量,並使用樹形圖。答案永遠是「(你所要的路徑) / (所有可能路徑的總和)」。

你一定做得到!練習是關鍵,所以多做一些題目,並盡可能畫樹形圖。祝你好運!