M1 學習筆記:二項分佈
各位同學好!歡迎來到統計學其中一個最有用的課題筆記:二項分佈 (The Binomial Distribution)。就算個名聽落好複雜都唔使擔心,其實佢係個好實用、好有邏輯嘅工具,幫我哋理解日常生活中經常遇到嘅情況。
你有冇諗過,喺一份多項選擇題測驗入面,估中答案嘅機會有幾大?又或者一個籃球員射入若干個罰球嘅概率係幾多?二項分佈就係解答呢啲問題嘅關鍵!喺呢一章,你會學到:
- 咩係「伯努利試驗」(Bernoulli trial) (佢係最簡單嘅構成要素)。
- 點樣辨識符合二項分佈嘅情況。
- 點樣運用公式嚟計算概率。
- 點樣快速搵到平均值 (期望值) 同方差。
等我哋一齊深入了解吓啦,你就會發現佢比想像中簡單得多㗎!
1. 基礎構成:伯努利試驗
喺我哋識跑之前,我哋要先學行。「二項分佈」嘅「行」就係「伯努利試驗 (Bernoulli trial)」。佢個名聽落好似好專業,但其實只係一個好簡單嘅概念。
一個伯努利試驗係指一個單次實驗,而佢只有兩種可能嘅結果。
我哋通常會將呢兩種結果標籤為:
- 成功 (Success):我哋有興趣數算嘅結果。
- 失敗 (Failure):另一個可能嘅結果。
重要提示:「成功」唔一定係指一件好事!如果你係研究某件產品有缺陷嘅概率,咁發現一件「有缺陷」嘅產品,對呢個實驗嚟講就係「成功」。佢只係一個標籤,用嚟表示你正在數算嘅嗰樣嘢。
伯努利試驗嘅例子:
- 擲一個公字一次: 成功 = 擲到公,失敗 = 擲到字。
- 射一次罰球: 成功 = 射入,失敗 = 射失。
- 生產線上嘅單一產品: 成功 = 產品有缺陷,失敗 = 產品冇缺陷。
喺任何伯努利試驗入面,我哋會用 p 代表成功嘅概率,而 1-p 就代表失敗嘅概率。
重點提示
伯努利試驗係一個單次實驗,只有兩個結果:成功或失敗。佢係二項分佈嘅基本構成部分。
2. 咩係二項分佈?
咁當我哋連續做多次伯努利試驗嘅時候,會發生咩事呢?呢個時候,我哋就會得到一個二項分佈 (Binomial distribution)!
二項分佈描述咗喺固定次數嘅獨立伯努利試驗中,獲得特定數目成功嘅概率。
等我哋返去擲公字個例子。
擲一次係一個伯努利試驗。
連續擲五次就係一個二項實驗。 我哋就可以問類似「喺呢五次擲公字中,恰好擲到 3 次公嘅概率係幾多?」呢類問題。
符號表示:X ~ B(n, p)
呢個係表示一個隨機變數符合二項分佈嘅官方寫法。佢睇落好似程式碼咁,但一拆開就簡單易明㗎啦:
- X:呢個係我哋嘅離散隨機變數,代表我哋得到嘅成功次數。例如,X 可以係「喺 5 次擲公字中,擲到公嘅次數」。
- ~:呢條小波浪線只係表示「服從…分佈」。
- B:代表 Binomial (二項)。
- (n, p):呢兩個係分佈嘅「參數 (parameters)」。
- n = 總試驗次數。
- p = 任何單次試驗成功嘅概率。
例子:如果我哋擲一個公平嘅公字 10 次,同埋我哋數算擲到公嘅次數,咁符號表示就會係 X ~ B(10, 0.5)。喺呢度,n=10,p=0.5。
3. 點樣判斷係咪二項分佈問題?用 B.I.N.S. 口訣!
你唔可以將二項分佈套用喺所有問題度!一個情況必須符合四個特定條件。一個好好嘅方法去記住佢哋就係用口訣 B.I.N.S.
B.I.N.S. 清單:
B - Binary (二元):每次試驗係咪只有兩種可能結果 (成功/失敗)?
例子:擲骰擲到「4」(成功) 同 擲唔到「4」(失敗)。
I - Independent (獨立):一次試驗嘅結果係咪完全唔受之前試驗結果嘅影響?
例子:擲公字係獨立嘅。個公字唔會記得上次嘅結果。
非例子:從一副牌中不放回地抽取兩張牌。第二張牌嘅概率取決於第一張牌係咩。
N - Number of Trials (試驗次數):試驗次數 n 係咪事先固定咗?
例子:「我哋會恰好擲公字 20 次。」(固定)
非例子:「我哋會一直擲公字,直到擲到 3 次公為止。」(冇固定)
S - Same Probability (相同概率):成功嘅概率 p 係咪每次試驗都相同?
例子:擲一個公平骰擲到「6」嘅概率永遠係 1/6,無論你擲幾多次。
常見錯誤要避免
最常見嘅錯誤係喺冇檢查 B.I.N.S. 條件嘅情況下,就假設個問題係二項分佈。喺開始計算之前,記得永遠要喺腦海中快速檢查一次呢份清單!
重點提示
如果一個情況符合晒所有四個 B.I.N.S. 條件,咁佢就係一個二項分佈問題。如果其中一個條件都唔符合,你就唔可以用二項分佈公式。
4. 公式:你嘅計算工具
好啦,我哋已經辨識到一個二項分佈問題。咁點樣搵到概率呢?我哋會用到二項概率公式 (Binomial Probability Formula)。
如果 X ~ B(n, p),咁得到恰好 k 次成功嘅概率係:
$$P(X=k) = C_k^n p^k (1-p)^{n-k}$$唔好俾佢嚇親!等我哋將佢拆開成三個簡單部分:
- $$C_k^n$$ 呢個部分話俾我哋知喺「n」次試驗中,有「k」次成功嘅排列方式有幾多種。你喺核心數學 (Core Maths) 都見過佢㗎啦!佢就係組合公式,你可以喺你嘅計數機上搵到佢嘅 nCr 功能鍵。(例如,C_2^5 意思係「喺 5 件物品中,有幾多種方法可以選出 2 件?」)
- $$p^k$$ 呢個係得到「k」次成功嘅概率。如果一次成功嘅概率係「p」,咁「k」次成功嘅概率就係 p 乘自己 k 次。
- $$(1-p)^{n-k}$$ 呢個係其餘「n-k」次試驗為失敗嘅概率。如果成功嘅概率係「p」,咁失敗嘅概率就係「1-p」。我哋需要「n-k」次失敗。
逐步示範例子
問題:一個籃球員射入任何一個罰球嘅機會係 70%。如果佢射 5 球,佢恰好射入 4 球嘅概率係幾多?
步驟 1:識別 n、p 同 k。
- 呢個情況係二項分佈 (檢查 B.I.N.S.!)。
- 試驗次數,n = 5。
- 成功概率 (射入),p = 0.7。
- 我哋想要嘅成功次數,k = 4。
步驟 2:代入公式。 $$P(X=4) = C_4^5 (0.7)^4 (1-0.7)^{5-4}$$
步驟 3:計算每個部分。
- $C_4^5 = 5$ (用你計數機嘅 nCr 功能)
- $(0.7)^4 = 0.2401$
- $(1-0.7)^{5-4} = (0.3)^1 = 0.3$
步驟 4:將佢哋相乘。 $$P(X=4) = 5 \times 0.2401 \times 0.3 = 0.36015$$ 所以,佢恰好射入 5 球中嘅 4 球,大概有 36% 嘅機會。
5. 「恰好」以外:「最少」同「最多」
試題通常會要求你計算多於一個特定數字嘅概率。佢哋可能會問「最少 2 次成功」或者「最多 3 次成功」嘅概率。
「最多 k 個」成功:P(X ≤ k)
呢個意思係 k 次成功、或者 k-1 次、或者 k-2 次、...,一直到 0 次。你需要計算每個概率再將佢哋加埋。
$$P(X \le k) = P(X=0) + P(X=1) + ... + P(X=k)$$
「最少 k 個」成功:P(X ≥ k)
呢個意思係 k 次成功、或者 k+1 次、...,一直到 n 次。你可以將佢哋全部加埋,但有一個更快嘅方法:互補事件法則 (complement rule)。
所有結果嘅總概率係 1。所以,「最少 k 次」嘅概率等於 1 減去「少於 k 次」嘅概率。 $$P(X \ge k) = 1 - P(X < k)$$ $$P(X \ge k) = 1 - [P(X=0) + P(X=1) + ... + P(X=k-1)]$$
例子:籃球員射入最少 4 球 (總共 5 球) 嘅概率係幾多?
「最少 4 球」意思係 P(X=4) 或者 P(X=5)。
$$P(X \ge 4) = P(X=4) + P(X=5)$$
我哋之前已經搵到 P(X=4) = 0.36015。
而家我哋搵 P(X=5):
$$P(X=5) = C_5^5 (0.7)^5 (0.3)^0 = 1 \times 0.16807 \times 1 = 0.16807$$
所以,P(X ≥ 4) = 0.36015 + 0.16807 = 0.52822。
6. 速學:期望值與方差
有時,我哋唔需要計算特定嘅概率。我哋只係想知道平均結果,或者結果可能嘅分散程度。幸運嘅係,二項分佈嘅期望值同方差公式都非常簡單!
期望值,E(X)
呢個係如果你重複進行實驗好多好多次,預期會得到嘅平均成功次數。
$$E(X) = np$$
方差,Var(X)
呢個衡量咗分佈嘅「分散程度」。方差越大,代表結果越難預測。
$$Var(X) = np(1-p)$$
(課程備註:呢啲公式嘅證明唔係考試要求。你只需要知道佢哋同點樣運用佢哋!)
例子:
如果你擲一個公平嘅公字 100 次 (n=100, p=0.5),預期擲到公嘅次數同方差係幾多?
期望值: $$E(X) = np = 100 \times 0.5 = 50$$ 呢個結果完全合理!你預期會擲到 50 次公。
方差: $$Var(X) = np(1-p) = 100 \times 0.5 \times (1-0.5) = 100 \times 0.5 \times 0.5 = 25$$
你知唔知?
當 p = 0.5 嘅時候,二項分佈嘅方差係最高嘅。呢個意思係當成功同失敗嘅機會均等時 (好似擲公字咁),一個實驗嘅結果最難預測!
章節總結:快速回顧
以下係你對二項分佈需要記住嘅絕對重點。
- 伯努利試驗: 單次實驗,只有兩個結果 (成功/失敗)。
- 二項條件 (B.I.N.S.):
- Binary outcomes (二元結果)
- Independent trials (獨立試驗)
- Number of trials is fixed (試驗次數固定)
- Same probability of success (成功概率相同)
- 符號表示:
$$X \sim B(n, p)$$ - 概率公式:
$$P(X=k) = C_k^n p^k (1-p)^{n-k}$$ - 期望值:
$$E(X) = np$$ - 方差:
$$Var(X) = np(1-p)$$
就係咁多!透過理解呢啲核心概念,你就掌握咗一個強大嘅工具,可以解決各種各樣嘅概率問題。勤力練習使用 B.I.N.S. 清單同埋公式,你很快就會精通呢個課題㗎啦。祝你學習順利!