M1 溫習筆記:離散隨機變數

哈囉!歡迎來到 M1 統計學中最有趣的主題之一:離散隨機變數 的溫習筆記。這個名字聽起來有點複雜,但別擔心,我們會將所有概念逐一拆解,變得簡單易明。

在本章中,我們會學習如何將數字賦予隨機事件的結果(例如擲骰子或擲硬幣),然後探索我們可以對這些數字做出什麼預測。這是一個超級重要的概念,廣泛應用於玩遊戲、保險以至工廠的品質控制等各個領域。我們立即開始吧!


1. 什麼是離散隨機變數?

先從基礎開始:什麼是隨機變數?

想像你擲一個標準的六面骰子。結果是隨機的,對吧?一個隨機變數,我們通常會用 X 來表示,它其實就是一種將數值賦予每個可能結果的方法。

例子:如果我們擲一個骰子,我們可以將隨機變數 X 定義為擲出的點數。那麼,X 的可能值就是 1、2、3、4、5 和 6。

你可以把 X 想成是一個代表數值結果的「替身」,在事件實際發生之前就存在。

關鍵概念:「離散」

離散」這個詞的意思是,變數只能取特定的、分開且可數的值。這些數值之間有空隙,你可以列出所有可能的結果。

  • 好例子(離散):課室裡的學生人數。你可以有 30 個學生或 31 個學生,但你不可能有 30.5 個學生。你可以數清他們。
  • 好例子(離散):你擲兩個骰子得到的總和。可能的值是 2、3、4、...、12。這些數值之間存在空隙。
  • 非例子(連續):學生的身高。某人可能是 175 厘米、175.1 厘米,甚至是 175.11 厘米高。你無法列出所有可能的身高,因為這些數值在一個連續的尺度上。(連續變數會在之後的章節中講解!
重點提示

一個離散隨機變數是指其數值由隨機實驗結果決定,並且其可能值是可數的變數。


2. 概率分佈:隨機變數的規則手冊

什麼是概率分佈?

一個概率分佈是一個表格、圖表或公式,它告訴我們離散隨機變數 X 每個可能值的概率。它就像是隨機變數行為的完整摘要。

比喻:你可以想像它像一份餐牌。X 的可能值是菜式,而概率就是它們的價錢。概率分佈列出了每道菜式及其價錢。

離散概率分佈的兩大黃金定律

對於任何有效的概率分佈,有兩條規則『必須』成立:

  1. 每個值 x 的概率必須介乎於 0 和 1 之間(包括兩端)。
    $$0 \leq P(X=x) \leq 1$$
  2. 所有可能值的概率總和必須剛好是 1。
    $$\sum P(X=x) = 1$$
    這很合理吧?這意味著所有可能的結果中,必然有一個會發生!

如何展示概率分佈

有幾種方式,但對我們來說最常見的是表格

逐步示例

我們來為一枚不均勻硬幣建立一個概率分佈,其中擲出正面的概率是 0.6。讓隨機變數 X 為單次擲硬幣中正面的次數。

步驟 1:識別 X 的可能值。
如果你擲一次硬幣,你可能會得到 0 次正面(即反面)或 1 次正面。所以,X 的值是 0 和 1。

步驟 2:找出每個值的概率。

  • P(X=1) = P(正面) = 0.6
  • P(X=0) = P(反面) = 1 - P(正面) = 1 - 0.6 = 0.4

步驟 3:將其放入表格。

x 0 1
P(X = x) 0.4 0.6

步驟 4:檢查兩大黃金定律!
所有概率都介乎於 0 和 1 之間嗎?是的。它們的總和是 1 嗎?是的,0.4 + 0.6 = 1。所以這是一個有效的概率分佈!

重點提示

一個概率分佈將隨機事件的每個可能數值結果與其發生的概率聯繫起來。所有概率的總和必須總是 1。


3. 期望值:平均來說會期待什麼

什麼是期望值,E(X)?

一個隨機變數的期望值,寫作 E(X),是你重複實驗很多很多次後,預期會得到的長期平均值。它是概率分佈的平均數

比喻:想像一個遊戲:你擲骰子,擲到多少點就贏多少錢。有時候你會贏 $1,有時候會贏 $6。如果你玩這個遊戲數千次,你每局平均贏多少錢?那就是期望值。

重要:期望值不一定是 X 實際可以取到的值!對於一個均勻骰子,E(X) = 3.5,但你永遠不可能擲出 3.5。

期望值的公式

要計算 E(X),你需要將每個可能的值 x 乘以其概率 P(X=x),然後將它們全部加起來。

$$E(X) = \sum x \cdot P(X=x)$$
逐步示例

假設一個遊戲的贏取金額 (X) 有以下概率分佈。

x ($) 0 10 50
P(X = x) 0.7 0.2 0.1

計算:
E(X) = (0 × 0.7) + (10 × 0.2) + (50 × 0.1)
E(X) = 0 + 2 + 5
E(X) = 7

所以,如果你玩很多次,平均來說,你每局遊戲預期會贏得 $7。

期望值的特性

這些超級實用的捷徑!

對於任何常數 ab: $$E(aX + b) = aE(X) + b$$

簡單來說:如果你將隨機結果 X 乘以 a,然後加上 b,新的期望值就只是舊的期望值乘以 a,再加上 b

例子:在上述遊戲中,E(X) = 7。如果遊戲主持人決定將你的贏取金額加倍,再額外給你 $5 獎金,新的贏取金額是 Y = 2X + 5。新的預期贏取金額是 E(Y) = 2E(X) + 5 = 2(7) + 5 = $19。

函數的期望值,E[g(X)]

有時我們需要計算 X 某個函數的期望值,例如 E(X²)。規則是相似的:將函數應用於每個 x 值,然後乘以其概率並加起來。

$$E[g(X)] = \sum g(x) \cdot P(X=x)$$

對於 E(X²),這就變成: $$E(X^2) = \sum x^2 \cdot P(X=x)$$

使用我們的遊戲例子:
E(X²) = (0² × 0.7) + (10² × 0.2) + (50² × 0.1)
E(X²) = (0 × 0.7) + (100 × 0.2) + (2500 × 0.1)
E(X²) = 0 + 20 + 250 = 270。(我們在計算方差時會用到這個!

重點提示

期望值 E(X) 是隨機變數結果的加權平均數。它告訴你長期平均值。使用 $$E(X) = \sum x \cdot P(X=x)$$ 來計算它。


4. 方差:衡量分散程度

什麼是方差,Var(X)?

方差,寫作 Var(X),衡量隨機變數的數值與其期望值(即平均數)之間的分散程度。

  • 小方差意味著結果通常非常接近期望值。(一致、可預測
  • 大方差意味著結果非常分散。(不一致、風險高

比喻:兩位籃球員每場比賽的預期得分可能都是 20 分。球員 A 的得分是 19、20、21、20(低方差)。球員 B 的得分是 40、0、30、10(高方差)。他們的平均分相同,但球員 B 的表現遠遠更難預測。

方差的最佳公式(捷徑!)

雖然方差的定義是 $$Var(X) = E[(X - E(X))^2]$$,但它計算起來比較困難。我們會使用一個簡單得多的公式:

$$Var(X) = E(X^2) - [E(X)]^2$$

要小心喔!注意 `E(X²) `(平方值的平均數)和 `[E(X)]²`(平均數的平方)之間的區別。這是個常見的錯誤點!

逐步示例(使用我們之前的遊戲)

我們之前已經找到 E(X) = 7E(X²) = 270

步驟 1:將數值代入公式。
Var(X) = E(X²) - [E(X)]²
Var(X) = 270 - (7)²
Var(X) = 270 - 49
Var(X) = 221

這個數字告訴我們數據的分散程度相當大。

那麼標準差呢?

標準差就是方差的平方根。它的符號是 σ (sigma) 或 SD(X)。

$$SD(X) = \sqrt{Var(X)}$$

主要優點是它的單位與隨機變數 X 相同,這使得理解分散程度變得更容易。

方差的特性

就像期望值一樣,我們也有一些方便的捷徑!

對於任何常數 ab: $$Var(aX + b) = a^2 Var(X)$$

簡單來說:

  • 加上一個常數 b 只會使整個分佈平移;它並不會改變它的分散程度。這就是為什麼 b 會從公式中消失。
  • 乘以一個常數 a 會「拉伸」分佈,使分散程度增加 倍。

例子:對於我們的遊戲,Var(X) = 221。如果主持人將贏取金額加倍並額外給 $5 獎金 (Y = 2X + 5),新的方差是 Var(Y) = 2² Var(X) = 4 × 221 = 884。分散程度變得大得多!

重點提示

方差 Var(X) 衡量數據圍繞平均數的分散程度。使用捷徑公式 $$Var(X) = E(X^2) - [E(X)]^2$$ 來計算它。


5. 二項分佈

二項分佈和泊松分佈是兩種特定的、常見的離散分佈類型。掌握它們的使用時機是關鍵!

何時使用二項分佈

當實驗包含固定數量的獨立試驗,且每次試驗都只有兩種可能的結果時,二項分佈就是你的工具。

首先,一個快速定義:伯努利試驗是只有兩種結果(通常稱為「成功」和「失敗」)的單次實驗。(例如:一次擲硬幣

如果一個實驗符合這四個條件,它就遵循二項分佈。一個好用的助記詞是 B.I.N.S.

  • B - 二元 (Binary):每次試驗只有兩種可能的結果(「成功」或「失敗」)。
  • I - 獨立 (Independent):一次試驗的結果不影響另一次試驗的結果。
  • N - 次數 (Number):試驗的次數是固定的,我們稱之為 n
  • S - 成功 (Success):每次試驗成功的概率,我們稱之為 p,是相同的。

如果符合這些條件,且 X成功次數的隨機變數,我們寫作: $$X \sim B(n, p)$$ 這表示「$X$ 遵循參數為 $n$(試驗次數)和 $p$(成功概率)的二項分佈。」

經典例子:擲一枚均勻硬幣 10 次,並計算正面的次數。這裡,n=10,p=0.5。

二項概率公式

n 次試驗中恰好得到 k 次成功的概率是:

$$P(X=k) = C_k^n p^k (1-p)^{n-k}$$

其中:

  • $$C_k^n$$ 是指從 n 次試驗中選出 k 次成功的方法數。
  • $$p^k$$ 是 k 次成功的概率。
  • $$(1-p)^{n-k}$$ 是其餘 n-k 次試驗失敗的概率。
逐步示例

一個學生參加一個 5 題的多項選擇題測驗。每題有 4 個選項,而且學生每題都靠猜。他恰好答對 3 題的概率是多少?

步驟 1:檢查是否為二項分佈 (B.I.N.S.)。

  • B 二元:是的,每題要麼「答對」(成功)要麼「答錯」(失敗)。
  • I 獨立:是的,猜一題的結果不影響另一題。
  • N 次數:是的,試驗的固定次數是 n = 5。
  • S 成功:是的,每題猜對的概率是 1/4,所以 p = 0.25。

它符合二項分佈!所以,$$X \sim B(5, 0.25)$$。我們想找出 P(X=3)。

步驟 2:使用公式,其中 n=5,p=0.25,k=3。

$$P(X=3) = C_3^5 (0.25)^3 (1-0.25)^{5-3}$$ $$P(X=3) = 10 \cdot (0.015625) \cdot (0.5625)$$ $$P(X=3) \approx 0.0879$$

所以他大約有 8.8% 的機會恰好猜對 3 題。

二項分佈的平均數與方差

幸運的是,我們不需要使用期望值和方差的大公式。對於二項分佈,有一些簡單的捷徑(你不需要知道證明!):

  • 平均數 (期望值): $$E(X) = np$$
  • 方差: $$Var(X) = np(1-p)$$

對於我們的測驗猜題例子:
預期答對題數:E(X) = 5 × 0.25 = 1.25。
方差:Var(X) = 5 × 0.25 × (0.75) = 0.9375。

重點提示

當處理固定數量的獨立試驗且只有兩種結果時,使用二項分佈。記住 B.I.N.S. 和關鍵公式:$$P(X=k) = C_k^n p^k (1-p)^{n-k}$$、$$E(X) = np$$ 和 $$Var(X) = np(1-p)$$。


6. 泊松分佈

何時使用泊松分佈

泊松分佈與眾不同。它描述了在固定時間或空間區間內事件發生的次數,而你已知事件的平均發生率。

在以下情況下使用泊松分佈:

  • 事件是隨機的並且相互獨立。
  • 我們正在計算在一個區間(例如時間、面積、距離)內事件發生的次數。
  • 我們唯一知道的是事件的平均發生率,我們稱之為 λ (lambda)

如果符合這些條件,且 X 是在該區間內事件發生次數的隨機變數,我們寫作: $$X \sim Po(\lambda)$$ 這表示「$X$ 遵循參數為 $\lambda$(平均發生率)的泊松分佈。」

經典例子:你的收件箱在一個小時內收到的電郵數量;10 米布料中的瑕疵數量;服務中心每分鐘的來電數量。

泊松概率公式

在一個區間內觀察到恰好 k 個事件的概率是:

$$P(X=k) = \frac{e^{-\lambda} \lambda^k}{k!}$$

其中:

  • λ 是每個區間的平均事件數。
  • k 是我們感興趣的事件數。
  • e 是歐拉數(約為 2.718...)。

最重要的技巧:調整 λ

一個非常常見的考試題目是給你一個區間的速率,但卻要求在不同區間的概率。在使用公式之前,你『必須』調整 λ。

例子:如果一間商店每小時平均接待 10 位顧客,而你想找出在 30 分鐘內有顧客光顧的概率,你的新 λ 將會是:
λ = (10 位顧客 / 60 分鐘) × 30 分鐘 = 5 位顧客。

逐步示例

醫院急症室每小時平均接收 3 名病人。在特定的一小時內,恰好有 4 名病人抵達的概率是多少?

步驟 1:識別分佈和參數。
這是關於在固定區間(一小時)內事件(病人抵達)的數量,且已知平均發生率。這是泊松分佈!
速率是 λ = 每小時 3 名病人。間隔時間為一小時,所以不需要調整。我們想找出 P(X=4)。

步驟 2:使用公式,其中 λ=3,k=4。

$$P(X=4) = \frac{e^{-3} \cdot 3^4}{4!}$$ $$P(X=4) = \frac{e^{-3} \cdot 81}{24}$$ $$P(X=4) \approx \frac{0.049787 \cdot 81}{24}$$ $$P(X=4) \approx 0.168$$

所以大約有 16.8% 的機會恰好有 4 名病人在該小時內抵達。

泊松分佈的平均數與方差

這部分最容易記住!對於泊松分佈,平均數和方差是相同的,並且都等於 λ。

  • 平均數 (期望值): $$E(X) = \lambda$$
  • 方差: $$Var(X) = \lambda$$

如果你看到一個問題中,一個分佈的平均數和方差約相等,這是一個重要線索,它很可能就是泊松分佈!

你知道嗎?

泊松分佈是以法國數學家西蒙·德尼·泊松(Siméon Denis Poisson)的名字命名。它有時被稱為「稀有事件的分佈」,因為它適用於在任何特定時刻發生概率很低,但在長時間內會多次發生的事件。

重點提示

當你知道平均發生率 λ 時,使用泊松分佈來計算固定區間內事件的數量。永遠要檢查是否需要調整 λ!關鍵公式是 $$P(X=k) = \frac{e^{-\lambda} \lambda^k}{k!}$$,以及獨特的特性 $$E(X) = Var(X) = \lambda$$。