M1 學習筆記:二項分佈
各位同學好!歡迎來到統計學其中一個最有用的課題筆記:二項分佈 (The Binomial Distribution)。即使名稱聽起來很複雜也不用擔心,其實它是一個非常實用、很有邏輯的工具,幫助我們理解日常生活中經常遇到的情況。
你有沒有想過,在一份多項選擇題測驗裡面,猜中答案的機會有多大?又或者一個籃球員射入若干個罰球的機率是多少?二項分佈就是解答這些問題的關鍵!在這一章,你會學到:
- 什麼是「伯努利試驗」(Bernoulli trial) (它是最簡單的構成要素)。
- 如何辨識符合二項分佈的情況。
- 如何運用公式來計算機率。
- 如何快速找到平均值 (期望值) 和方差。
讓我們一起深入了解吧,你就會發現它比想像中簡單得多!
1. 基礎構成:伯努利試驗
在我們學會跑之前,我們必須先學會走。「二項分佈」的「走」就是「伯努利試驗 (Bernoulli trial)」。它的名稱聽起來很專業,但其實只是一個很簡單的概念。
一個伯努利試驗是指一個單次實驗,而它只有兩種可能的結果。
我們通常會將這兩種結果標籤為:
- 成功 (Success):我們有興趣計數的結果。
- 失敗 (Failure):另一個可能的結果。
重要提示:「成功」不一定是指一件好事!如果你是研究某件產品有缺陷的機率,那麼發現一件「有缺陷」的產品,對這個實驗來說就是「成功」。它只是一個標籤,用來表示你正在計數的那樣東西。
伯努利試驗的例子:
- 擲一枚硬幣一次: 成功 = 擲到正面,失敗 = 擲到反面。
- 射一次罰球: 成功 = 射入,失敗 = 射失。
- 生產線上的單一產品: 成功 = 產品有缺陷,失敗 = 產品無缺陷。
在任何伯努利試驗中,我們會用 p 代表成功的機率,而 1-p 就代表失敗的機率。
重點提示
伯努利試驗是一個單次實驗,只有兩個結果:成功或失敗。它是二項分佈的基本構成部分。
2. 什麼是二項分佈?
那麼當我們連續進行多次伯努利試驗的時候,會發生什麼事呢?這個時候,我們就會得到一個二項分佈 (Binomial distribution)!
二項分佈描述了在固定次數的獨立伯努利試驗中,獲得特定數目成功的機率。
讓我們回到擲硬幣的例子。
擲一次是一個伯努利試驗。
連續擲五次就是一個二項實驗。 我們就可以問類似「在這五次擲硬幣中,恰好擲到 3 次正面的機率是多少?」這類問題。
符號表示:X ~ B(n, p)
這是表示一個隨機變數符合二項分佈的官方寫法。它看起來像程式碼,但一拆開就簡單易懂了:
- X:這是我們的離散隨機變數,代表我們得到的成功次數。例如,X 可以是「在 5 次擲硬幣中,擲到正面的次數」。
- ~:這條小波浪線只是表示「服從…分佈」。
- B:代表 Binomial (二項)。
- (n, p):這兩個是分佈的「參數 (parameters)」。
- n = 總試驗次數。
- p = 任何單次試驗成功的機率。
例子:如果我們擲一枚公平的硬幣 10 次,以及我們計數擲到正面的次數,那麼符號表示就會是 X ~ B(10, 0.5)。在這裡,n=10,p=0.5。
3. 如何判斷是不是二項分佈問題?用 B.I.N.S. 口訣!
你不能將二項分佈套用在所有問題上!一個情況必須符合四個特定條件。一個很好的方法去記住它們就是用口訣 B.I.N.S.
B.I.N.S. 清單:
B - Binary (二元):每次試驗是不是只有兩種可能結果 (成功/失敗)?
例子:擲骰擲到「4」(成功) 和 擲不到「4」(失敗)。
I - Independent (獨立):一次試驗的結果是不是完全不受之前試驗結果的影響?
例子:擲硬幣是獨立的。那枚硬幣不會記得上次的結果。
非例子:從一副牌中不放回地抽取兩張牌。第二張牌的機率取決於第一張牌是什麼。
N - Number of Trials (試驗次數):試驗次數 n 是不是事先固定了?
例子:「我們會恰好擲硬幣 20 次。」(固定)
非例子:「我們會一直擲硬幣,直到擲到 3 次正面為止。」(無固定)
S - Same Probability (相同機率):成功的機率 p 是不是每次試驗都相同?
例子:擲一個公平骰擲到「6」的機率永遠是 1/6,無論你擲多少次。
常見錯誤要避免
最常見的錯誤是在沒有檢查 B.I.N.S. 條件的情況下,就假設那個問題是二項分佈。在開始計算之前,記得永遠要在腦海中快速檢查一次這份清單!
重點提示
如果一個情況符合所有四個 B.I.N.S. 條件,那麼它就是一個二項分佈問題。如果其中一個條件都不符合,你就不能用二項分佈公式。
4. 公式:你的計算工具
好的,我們已經辨識到一個二項分佈問題。那麼如何找到機率呢?我們會用到二項機率公式 (Binomial Probability Formula)。
如果 X ~ B(n, p),那麼得到恰好 k 次成功的機率是:
$$P(X=k) = C_k^n p^k (1-p)^{n-k}$$不要被它嚇到!讓我們將它拆開成三個簡單部分:
- $$C_k^n$$ 這個部分告訴我們在「n」次試驗中,有「k」次成功的排列方式有多少種。你在核心數學 (Core Maths) 都見過它了!它就是組合公式,你可以在你的計算機上找到它的 nCr 功能鍵。(例如,C_2^5 意思是「在 5 件物品中,有多少種方法可以選出 2 件?」)
- $$p^k$$ 這是得到「k」次成功的機率。如果一次成功的機率是「p」,那麼「k」次成功的機率就是 p 乘自己 k 次。
- $$(1-p)^{n-k}$$ 這是其餘「n-k」次試驗為失敗的機率。如果成功的機率是「p」,那麼失敗的機率就是「1-p」。我們需要「n-k」次失敗。
逐步示範例子
問題:一個籃球員射入任何一個罰球的機會是 70%。如果他射 5 球,他恰好射入 4 球的機率是多少?
步驟 1:識別 n、p 和 k。
- 這個情況是二項分佈 (檢查 B.I.N.S.!)。
- 試驗次數,n = 5。
- 成功機率 (射入),p = 0.7。
- 我們想要的成功次數,k = 4。
步驟 2:代入公式。$$P(X=4) = C_4^5 (0.7)^4 (1-0.7)^{5-4}$$
步驟 3:計算每個部分。
- $C_4^5 = 5$ (用你的計算機的 nCr 功能)
- $(0.7)^4 = 0.2401$
- $(1-0.7)^{5-4} = (0.3)^1 = 0.3$
步驟 4:將它們相乘。$$P(X=4) = 5 imes 0.2401 imes 0.3 = 0.36015$$所以,他恰好射入 5 球中的 4 球,大約有 36% 的機會。
5. 「恰好」以外:「最少」和「最多」
試題通常會要求你計算多於一個特定數字的機率。它們可能會問「最少 2 次成功」或者「最多 3 次成功」的機率。
「最多 k 個」成功:P(X ≤ k)
這個意思是指 k 次成功、或者 k-1 次、或者 k-2 次、...,一直到 0 次。你需要計算每個機率再將它們加起來。$$P(X
ule[0.5ex]{0.5em}{0.1ex} k) = P(X=0) + P(X=1) + ... + P(X=k)$$
「最少 k 個」成功:P(X ≥ k)
這個意思是指 k 次成功、或者 k+1 次、...,一直到 n 次。你可以將它們全部加起來,但有一個更快的方法:互補事件法則 (complement rule)。
所有結果的總機率是 1。所以,「最少 k 次」的機率等於 1 減去「少於 k 次」的機率。$$P(X ule[0.5ex]{0.5em}{0.1ex} k) = 1 - P(X < k)$$$$P(X ule[0.5ex]{0.5em}{0.1ex} k) = 1 - [P(X=0) + P(X=1) + ... + P(X=k-1)]$$
例子:籃球員射入最少 4 球 (總共 5 球) 的機率是多少?
「最少 4 球」意思是指 P(X=4) 或者 P(X=5)。$$P(X
ule[0.5ex]{0.5em}{0.1ex} 4) = P(X=4) + P(X=5)$$
我們之前已經找到 P(X=4) = 0.36015。
現在我們找 P(X=5):$$P(X=5) = C_5^5 (0.7)^5 (0.3)^0 = 1 imes 0.16807 imes 1 = 0.16807$$
所以,P(X ≥ 4) = 0.36015 + 0.16807 = 0.52822。
6. 速學:期望值與方差
有時,我們不需要計算特定的機率。我們只是想知道平均結果,或者結果可能的分散程度。幸運的是,二項分佈的期望值和方差公式都非常簡單!
期望值,E(X)
這是如果你重複進行實驗很多很多次,預期會得到的平均成功次數。$$E(X) = np$$
方差,Var(X)
這個衡量了分佈的「分散程度」。方差越大,代表結果越難預測。$$Var(X) = np(1-p)$$
(課程備註:這些公式的證明不是考試要求。你只需要知道它們和如何運用它們!)
例子:
如果你擲一枚公平的硬幣 100 次 (n=100, p=0.5),預期擲到正面的次數和方差是多少?
期望值:$$E(X) = np = 100 imes 0.5 = 50$$這個結果完全合理!你預期會擲到 50 次正面。
方差:$$Var(X) = np(1-p) = 100 imes 0.5 imes (1-0.5) = 100 imes 0.5 imes 0.5 = 25$$
你知道嗎?
當 p = 0.5 的時候,二項分佈的方差是最高的。這個意思是指當成功和失敗的機會均等時 (好似擲硬幣一樣),一個實驗的結果最難預測!
章節總結:快速回顧
以下是你對二項分佈需要記住的絕對重點。
- 伯努利試驗: 單次實驗,只有兩個結果 (成功/失敗)。
- 二項條件 (B.I.N.S.):
- Binary outcomes (二元結果)
- Independent trials (獨立試驗)
- Number of trials is fixed (試驗次數固定)
- Same probability of success (成功機率相同)
- 符號表示:
$$X \sim B(n, p)$$ - 機率公式:
$$P(X=k) = C_k^n p^k (1-p)^{n-k}$$ - 期望值:
$$E(X) = np$$ - 方差:
$$Var(X) = np(1-p)$$
就是這麼多!透過理解這些核心概念,你就掌握了一個強大的工具,可以解決各種各樣的機率問題。勤奮練習使用 B.I.N.S. 清單以及公式,你很快就會精通這個課題了。祝你學習順利!