M1 章節:概率分佈、期望值與方差
大家好!歡迎來到統計學中最有趣的話題之一。如果你之前覺得概率(或稱概率)有點抽象,不用擔心。在本章中,我們會探討概率分佈,令這些概念更具體。我們將學習如何運用期望值來預測隨機事件的「平均」結果,並使用方差來衡量結果的離散程度。
為何這很重要?它支撐著各種博弈遊戲、保險政策,甚至金融投資背後的數學原理。學完這些,你將能夠分析一個簡單的遊戲,並判斷它是否值得一玩!
1. 離散概率分佈:隨機事件的「遊戲規則」
什麼是離散隨機變數?
想像「隨機變數」是一個變數(我們通常稱之為 X),其數值由隨機實驗的結果決定。「離散」這個詞只是指它只能取特定、可數的數值。你不會得到「半個」結果。
- 例子:設 X 為擲標準六面骰子所得的點數。X 可以是 1、2、3、4、5 或 6。它不可能是 2.5。
- 例子:設 Y 為擲硬幣 3 次所得的正面向上的次數。Y 可以是 0、1、2 或 3。
- 類比:離散變數就像房間裡的人數。你可以有 3 個人或 4 個人,但不能有 3.5 個人。
什麼是概率分佈?
一個概率分佈就是一個表格、圖形或公式,它將離散隨機變數的每個可能值與其對應的概率連結起來。它就是該隨機變數的完整「遊戲規則」。
任何概率分佈都有兩條黃金法則:
- 概率必須介乎 0 和 1 之間。對於任何值 x,$$0 \le P(X=x) \le 1$$。
- 所有概率之和必須恰好是 1。 $$\sum P(X=x) = 1$$。(這表示我們已考慮了所有可能的結果。)
想像它像一個薄餅:所有的薄餅片(概率)加起來必須是一個完整的薄餅!
表示概率分佈
表示概率分佈最常見的方法是使用一個簡單的表格。
例子:一個不公平硬幣
想像一個不公平的硬幣,擲出正面的概率是 0.4。設 X 為擲兩次硬幣中正面向上的次數。X 的可能值為 0、1 或 2。
P(X=0) = P(字字) = 0.6 * 0.6 = 0.36
P(X=1) = P(正字 或 字正) = (0.4 * 0.6) + (0.6 * 0.4) = 0.24 + 0.24 = 0.48
P(X=2) = P(正正) = 0.4 * 0.4 = 0.16
我們可以將其表示在分佈表中:
x 0 1 2
P(X = x) 0.36 0.48 0.16
讓我們檢查一下規則:所有概率都介乎 0 和 1 之間。如果我們將它們加起來:$$0.36 + 0.48 + 0.16 = 1.00$$。沒錯!
第一節重點提要
離散概率分佈列出了隨機事件所有可能的數值結果及其對應的概率。所有概率之和必須為 1。
2. 期望值 (E[X]):長遠平均值
什麼是期望值?
期望或期望值,記作 E[X],是我們將實驗重複無限次後預期會得到的平均值。它是一種「加權平均」,其中較可能發生的結果影響較大。
重要提示:期望值可能不是單次試驗中實際會出現的數字!例如,擲一次骰子的期望值是 3.5,但你不可能擲出 3.5。
類比:想像一個簡單的遊戲。你以 0.1 的概率贏得 10 元,以 0.9 的概率贏得 0 元。如果你玩這個遊戲 100 次,你預期會贏得 10 次,總共 100 元。你每次遊戲的平均贏得金額將是 $100 / 100 = $1。期望值是 1 元。
計算期望值
公式簡單且直觀。你將每個結果乘以其概率,然後將它們全部加起來。
公式: $$E[X] = \sum x \cdot P(X=x)$$
逐步範例
讓我們找出上述不公平硬幣例子中,正面向上的期望次數。
x 0 1 2
P(X = x) 0.36 0.48 0.16
- 將每個 x 乘以其 P(X=x):
(0 * 0.36) = 0
(1 * 0.48) = 0.48
(2 * 0.16) = 0.32 - 將結果加總:
$$E[X] = 0 + 0.48 + 0.32 = 0.8$$
因此,平均而言,我們預期每次試驗(兩次擲硬幣)會得到 0.8 次正面。
期望值的性質(實用捷徑!)
這些規則使計算速度大大加快。設 a 和 b 為常數。
性質一: $$E[aX + b] = aE[X] + b$$
換句話說:如果你將每個結果乘以「a」並加上「b」,期望值也會被乘以「a」並加上「b」。
例子:一個遊戲的派彩金額為 X(以元計),我們發現 E[X] = 5 元。遊戲組織者決定將派彩金額加倍並收取 2 元服務費。新的派彩金額為 Y = 2X - 2。新的期望派彩是多少?
$$E[Y] = E[2X - 2] = 2E[X] - 2 = 2(5) - 2 = 8 元$$ 無需重新計算整個分佈!
函數的期望值,E[g(X)]
有時我們對 X 的函數(例如 $$X^2$$)的期望值感興趣。計算方法非常相似。
公式: $$E[g(X)] = \sum g(x) \cdot P(X=x)$$
為了找出 $$E[X^2]$$,我們只需在乘以概率之前將每個 x 值平方。這對於之後計算方差將會非常重要。
例子:找出 E[X²]
再次使用我們的不公平硬幣例子:
$$E[X^2] = (0^2 \cdot 0.36) + (1^2 \cdot 0.48) + (2^2 \cdot 0.16)$$ $$E[X^2] = (0 \cdot 0.36) + (1 \cdot 0.48) + (4 \cdot 0.16)$$ $$E[X^2] = 0 + 0.48 + 0.64 = 1.12$$
常見錯誤警示:請注意,$$E[X^2] = 1.12$$ 與 $$(E[X])^2 = (0.8)^2 = 0.64$$ 並不相同。這是一個關鍵區別!
第二節重點提要
期望值 (E[X]) 是隨機變數的理論長期平均值。計算方法是將所有結果的「結果 × 概率」相加。其性質,特別是 $$E[aX + b] = aE[X] + b$$,是非常強大的捷徑。
3. 方差 (Var(X)):衡量離散程度與風險
什麼是方差?
期望值告訴我們分佈的「中心」位置,而方差則告訴我們結果與該中心「偏離」的程度。它衡量了波動性或風險。
- 低方差意味著大多數結果都緊密地聚集在期望值周圍。結果可預測且一致。
- 高方差意味著結果遠離期望值。結果不可預測且具風險。
類比:兩名學生,Amy 和 Ben,他們的平均考試分數(期望值)都是 80 分。
- Amy 的分數:79、80、81、80。(低方差 — 非常穩定)
- Ben 的分數:100、60、100、60。(高方差 — 波動很大!)
他們 的平均分數相同,但表現卻截然不同。方差捕捉了這種差異。
計算方差
方差有兩種公式。一種適合理解概念,另一種則是實際計算時的最佳幫手。
公式一:定義式(適合理論理解)
設 $$\mu = E[X]$$。方差是與均值平方差的期望值。 $$Var(X) = E[(X-\mu)^2] = \sum (x-\mu)^2 \cdot P(X=x)$$ 這個公式在實際應用中效率較低。
公式二:計算公式(請用這個!)
這個幾乎總是更快、更容易。
公式: $$Var(X) = E[X^2] - (E[X])^2$$
助記口訣:「平方的平均值,減去平均值的平方。」
逐步範例(使用快捷公式)
讓我們計算不公平硬幣例子的方差。我們在上一節已經完成了大部分繁重的工作!
- 回顧我們之前的結果:
$$E[X] = 0.8$$
$$E[X^2] = 1.12$$ - 將它們代入公式:
$$Var(X) = E[X^2] - (E[X])^2$$ $$Var(X) = 1.12 - (0.8)^2$$ $$Var(X) = 1.12 - 0.64 = 0.48$$
正面次數的方差是 0.48。
標準差
請注意,方差的單位是平方的(例如,平方元、平方次),這可能難以理解。為了解決這個問題,我們使用標準差,它就是方差的平方根。
公式: $$SD(X) = \sigma = \sqrt{Var(X)}$$
在我們的例子中,標準差是 $$\sqrt{0.48} \approx 0.693$$。這個值是原始單位(「次」),能更直接地表示離散程度。
方差的性質(更多超實用捷徑!)
就像期望值一樣,這些規則能省下大量時間。設 a 和 b 為常數。
性質一: $$Var(aX + b) = a^2 Var(X)$$
讓我們來拆解一下:
- 為何「+ b」會消失?加上一個常數「b」會使整個分佈平移,但並不會改變其離散程度。想像所有學生的考試分數都加了 10 分。平均分會增加 10 分,但最高分和最低分之間的差距保持不變。離散程度不變,所以方差也不變。
- 為何是「a²」?方差是基於平方差的。如果你將所有結果乘以「a」,那麼它們與均值的距離也會被「a」縮放。當你將這些距離平方時,縮放因子就變成了「a²」。
例子:
一個遊戲的派彩金額為 X,其方差 Var(X) = 4。組織者更改遊戲規則,使新的派彩金額為 Y = 3X + 10。新的方差是多少?
$$Var(Y) = Var(3X + 10)$$ $$= 3^2 Var(X)$$ $$= 9 \cdot 4 = 36$$
新的方差是 36。請注意,「+ 10」並沒有產生影響。
第三節重點提要
方差 (Var(X)) 衡量分佈的離散程度或風險。計算時務必使用計算公式 $$Var(X) = E[X^2] - (E[X])^2$$。請記住其關鍵性質:$$Var(aX + b) = a^2Var(X)$$。標準差就是方差的平方根。