常態變數的標準化及標準常態分佈表的使用

大家好!歡迎來到 M1 統計學中最實用課題之一的筆記。就算「常態分佈」或「標準化」這些詞語聽起來有點嚇人,也別擔心。看完這些筆記後,你會發現它們只是幫助我們理解周遭世界的簡單工具。

我們會學到什麼? 我們將會學習一個巧妙的技巧,叫做標準化。想像一下,這就像把不同的貨幣兌換成一種通用貨幣(例如港幣),以便輕鬆比較它們。我們會用這個方法來處理數據,並利用一個強大的工具——標準常態分佈表——來找出概率。

為什麼它很重要? 從你的考試分數、身高到一包薯片的重量,生活中很多事物都符合常態分佈。這個課題會給你一把鑰匙,解開所有這些情況的概率!我們開始吧。


重溫:到底什麼是常態分佈?

還記得鐘形曲線嗎?那就是常態分佈的標誌性外觀。它描述了許多現實生活中數據的分佈情況。

常態分佈由兩個關鍵資訊定義:

  • 平均值 ($$\mu$$):平均數值,位於鐘形曲線的正中央和峰頂。
  • 標準差 ($$\sigma$$):衡量數據分散程度的指標。較小的 $$ \sigma $$ 表示數據緊密地集中在平均值周圍(形成一個高而窄的鐘形);較大的 $$ \sigma $$ 表示數據非常分散(形成一個矮而寬的鐘形)。

我們會寫成 $$ X \sim N(\mu, \sigma^2) $$,讀作「變數 X 服從平均值為 $$\mu$$、方差為 $$\sigma^2$$ 的常態分佈」。(記住,方差就是標準差的平方!)

重大難題

想像一下,我們有香港中學文憑試數學 M1 的考試分數,其平均值可能是 65,標準差是 10。然後我們有香港中學文憑試物理科的分數,其平均值是 60,標準差是 15。這兩個是不同的常態分佈。$$\mu$$ 和 $$\sigma$$ 有無限多種可能的組合!我們怎麼可能為所有這些分佈計算概率呢?我們不可能為每一個分佈都準備一份單獨的概率表。我們需要一個「一勞永逸」的解決方案。

快速回顧:常態分佈的關鍵性質
  • 它呈鐘形,並圍繞平均值 ($$\mu$$) 完美對稱
  • 平均值、中位數和眾數都相等,且位於中心。
  • 曲線下的總面積正好是 1(或 100%)。這一點非常重要,因為面積代表概率!

主角登場:標準常態分佈

為了解決我們「分佈太多」的問題,數學家們創造了一個特殊的參考分佈,稱為標準常態分佈。它是可以與所有其他常態分佈進行比較的「超級明星」。

標準常態分佈具有固定性質:

  • 平均值 ($$\mu$$) 永遠是 0。
  • 標準差 ($$\sigma$$) 永遠是 1。

我們用字母 Z 來表示標準常態變數。所以,我們寫作:$$ \bf{Z \sim N(0, 1)} $$

因為這個分佈是「標準」的,我們為它準備了一份特殊的數值表——標準常態分佈表。這張表讓我們能夠找到任何 Z 值所對應的面積(概率)。

重點歸納

與其處理無數個不同的常態分佈 ($$ N(\mu, \sigma^2) $$),我們的目標是將其中任何一個轉換成唯一的標準常態分佈 ($$ N(0, 1) $$)。這個轉換過程稱為標準化


魔法公式:如何標準化(Z 值)

要將常態分佈中的任何值 (X) 轉換為標準常態分佈中等效的值 (Z),我們使用 Z 值公式。這是你本章最重要的公式!

$$ \bf{Z = \frac{X - \mu}{\sigma}} $$

公式拆解:

  • Z:這是你正在計算的Z 值。它告訴你原始值 (X) 距離平均值 ($$\mu$$) 有多少個標準差 ($$\sigma$$)。
  • X:你的原始數據點或感興趣的值(例如:考試分數 75 分)。
  • $$\mu$$:原始分佈的平均值(例如:班級平均分為 65 分)。
  • $$\sigma$$:原始分佈的標準差(例如:分數的離散程度是 5)。

日常生活類比:比較考試分數

想像你和朋友考了不同的 M1 模擬試。

  • 你的考試:你得了 80 分。班級平均值 ($$\mu$$) 是 70,標準差 ($$\sigma$$) 是 10
  • 朋友的考試:你朋友得了 85 分。他們班級平均值 ($$\mu$$) 是 75,標準差 ($$\sigma$$) 是 5

相對於各自的班級,誰的表現更好?讓我們計算你和朋友的 Z 值,將分數標準化。

你的 Z 值: $$ Z = \frac{80 - 70}{10} = \frac{10}{10} = \bf{+1.0} $$ 這表示你的分數剛好比班級平均高出 1 個標準差。

朋友的 Z 值: $$ Z = \frac{85 - 75}{5} = \frac{10}{5} = \bf{+2.0} $$ 這表示你朋友的分數竟然比他們班級平均高出 2 個標準差。

結論:儘管你朋友的 85 分只比你的 80 分高 5 分,但他們的 Z 值卻高得多。相對於他們的同學,他們表現得明顯更好。Z 值為我們提供了一個公平的比較方式!

Z 值有什麼意義?
  • 正 Z 值 表示該值 (X) 高於平均值 ($$\mu$$)。
  • 負 Z 值 表示該值 (X) 低於平均值 ($$\mu$$)。
  • Z 值為 0 表示該值 (X) 正好是平均值 ($$\mu$$)。

使用標準常態分佈表

一旦你計算出 Z 值,你就可以使用標準常態分佈表(考試時會提供)來找出概率。這張表乍看之下可能有點嚇人,但它其實只是一個簡單的查閱工具。

重要提示:標準常態分佈表通常提供 Z 值左側的面積。這代表概率 $$ \bf{P(Z < z)} $$。請務必檢查你所使用的表格所顯示的內容!

如何閱讀表格(以找出 $$P(Z < 1.34)$$ 為例)

  1. 拆分 Z 值:將 1.34 拆分為「1.3」和「0.04」。
  2. 尋找行:沿著最左邊的列向下查找,找到 1.3 所在的行。
  3. 尋找列:沿著頂部行查找,找到 .04 所在的列。
  4. 找出交點:行和列相交處的數值就是你的概率。對於 Z = 1.34,你應該會找到一個類似 0.9099 的數值。

所以,$$ P(Z < 1.34) = 0.9099 $$。這意味著 Z 值小於 1.34 的概率約為 91%。

處理不同類型的概率

你不會總是只被要求計算 $$P(Z < z)$$。以下是如何使用表格和曲線性質(總面積 = 1,以及對稱性)來找出其他概率的方法。

1. 大於某值的概率:$$ P(Z > z) $$

表格給你的是左側的面積。要找出右側的面積,你需要使用總面積的規則。

例子:找出 $$P(Z > 1.34)$$

公式: $$ \bf{P(Z > z) = 1 - P(Z < z)} $$

計算: $$ P(Z > 1.34) = 1 - P(Z < 1.34) = 1 - 0.9099 = \bf{0.0901} $$

2. 小於負值的概率:$$ P(Z < -z) $$

鐘形曲線是對稱的!-z 左側的面積與 +z 右側的面積是相同的。

例子:找出 $$P(Z < -1.34)$$

邏輯:根據對稱性,$$ P(Z < -1.34) $$ 與 $$ P(Z > 1.34) $$ 是相同的。我們已經計算過它了!

公式: $$ \bf{P(Z < -z) = P(Z > z) = 1 - P(Z < z)} $$

計算: $$ P(Z < -1.34) = 1 - P(Z < 1.34) = 1 - 0.9099 = \bf{0.0901} $$

3. 介乎兩值之間的概率:$$ P(a < Z < b) $$

要找出兩點之間的面積,你需要找出較大值 (b) 左側的面積,然後減去較小值 (a) 左側的面積。想像成「大面積 - 小面積」。

例子:找出 $$P(-1.0 < Z < 1.5)$$

公式: $$ \bf{P(a < Z < b) = P(Z < b) - P(Z < a)} $$

計算:
首先,從表格中找出兩部分:
$$ P(Z < 1.5) = 0.9332 $$
$$ P(Z < -1.0) = P(Z > 1.0) = 1 - P(Z < 1.0) = 1 - 0.8413 = 0.1587 $$

現在,相減:
$$ P(-1.0 < Z < 1.5) = 0.9332 - 0.1587 = \bf{0.7745} $$

常見錯誤避免
  • 忘記從 1 減去:這是計算 $$P(Z > z)$$ 問題時最常見的錯誤。務必仔細檢查你是否需要右側的面積!
  • Z 值與概率:Z 值(例如:1.34)是表格邊緣的「地址」。概率(例如:0.9099)是表格內部的數值。不要混淆它們!
  • 對稱性錯誤:快速畫出鐘形曲線能真正幫助你視覺化你要找的面積,並避免負 Z 值帶來的錯誤。

綜合應用:一個完整例子

某果園蘋果的重量服從常態分佈,平均值為 150 克 ($$\mu$$),標準差為 12 克 ($$\sigma$$)。試找出隨機抽取一個蘋果,其重量介乎 140 克與 165 克之間的概率。

步驟 1:寫下已知資訊和目標。

我們有一個常態分佈:$$X \sim N(150, 12^2)$$。
我們想找出 $$ \bf{P(140 < X < 165)} $$。

步驟 2:將兩個 X 值都標準化為 Z 值。

當 X = 140 時:$$ Z_1 = \frac{140 - 150}{12} = \frac{-10}{12} \approx -0.83 $$
當 X = 165 時:$$ Z_2 = \frac{165 - 150}{12} = \frac{15}{12} = 1.25 $$

步驟 3:用 Z 重新表達問題。

$$ P(140 < X < 165) $$ 等同於 $$ \bf{P(-0.83 < Z < 1.25)} $$

步驟 4:使用「大面積 - 小面積」規則和表格。

$$ P(-0.83 < Z < 1.25) = P(Z < 1.25) - P(Z < -0.83) $$

讓我們找出各部分:
從表格中,$$ P(Z < 1.25) = \bf{0.8944} $$
對於負 Z 值,我們使用對稱性: $$ P(Z < -0.83) = P(Z > 0.83) = 1 - P(Z < 0.83) = 1 - 0.7967 = \bf{0.2033} $$

步驟 5:計算最終答案。

$$ 0.8944 - 0.2033 = \bf{0.6911} $$

結論:隨機抽取一個蘋果,其重量介乎 140 克與 165 克之間的概率約為 0.6911(或 69.11%)。


總結與重點歸納

你成功了!讓我們快速回顧一下主要概念。

  • 原因:我們進行標準化是為了將任何常態分佈 $$N(\mu, \sigma^2)$$ 轉換為唯一的標準常態分佈 $$N(0, 1)$$,這樣我們就可以使用單一表格來找出概率。

  • 方法(Z 值公式): $$ \bf{Z = \frac{X - \mu}{\sigma}} $$ 這個公式是你的萬能鑰匙。它將你的數據點轉換為標準分數。

  • 工具(標準常態分佈表):這張表格提供 $$P(Z < z)$$。記住查找其他面積的規則:
    • $$ \bf{P(Z > z) = 1 - P(Z < z)} $$
    • $$ \bf{P(Z < -z) = 1 - P(Z < z)} $$ (利用對稱性)
    • $$ \bf{P(a < Z < b) = P(Z < b) - P(Z < a)} $$

這個過程一開始可能看起來很漫長,但只要多加練習,就會變得駕輕就熟。務必清楚地展示你的步驟:寫下公式,代入數值,找出 Z 值,然後找出概率。你一定做得到!