M1 溫習筆記:正態分佈的應用
哈囉!歡迎來到統計學中最實用課題之一的溫習筆記:正態分佈的應用。
你有沒有想過,公司如何知道每種尺碼的T恤要生產多少件,或者老師如何判斷一份新測驗的「好」分數是多少?答案往往藏在正態分佈中,它也以「鐘形曲線」的別名而聞名。
在本章中,我們將會超越理論層面,學習如何運用正態分佈來解決現實世界的問題。我們會學懂如何計算概率(例如學生考獲90分以上的機會),以及如何找出特定數據點(例如考入前10%所需的分數)。如果一開始覺得有點難,別擔心,我們會一步一步地拆解!
快速回顧:甚麼是標準化?
在我們深入新問題之前,讓我們先回顧最重要的工具:標準化。大多數現實生活中的數據都是正態分佈的,但它們都有自己獨特的平均值($$\mu$$)和標準差($$\sigma$$)。這就好比每個國家都有自己的貨幣一樣。為了方便比較,我們需要將它們轉換成一個共同的標準。
在統計學中,我們的「共同標準」就是標準正態分佈,它的平均值永遠是0,標準差永遠是1。我們將它表示為 $$Z \sim N(0, 1)$$.
將任何值 (X) 從正態分佈 $$N(\mu, \sigma^2)$$ 轉換為標準值 (Z) 的神奇公式就是z分數公式:
$$Z = \frac{X - \mu}{\sigma}$$其中:
- X 是你的特定數據點(例如,學生的身高)。
- $$\mu$$ (mu) 是分佈的平均值。
- $$\sigma$$ (sigma) 是分佈的標準差。
常見錯誤提示!
問題通常會提供方差($$\sigma^2$$),而不是標準差($$\sigma$$)。記住,在使用公式之前,務必先將方差取平方根!如果 $$X \sim N(100, 25)$$,那麼 $$\mu = 100$$ 而 $$\sigma = \sqrt{25} = 5$$。
第一部分:從數值找概率(「順向問題」)
這是最常見的問題類型。你會獲得一個(或多個)X值,然後需要找出與之相關的概率。
例題:某學校學生的身高呈正態分佈,平均值為165厘米,標準差為5厘米。隨機抽選一名學生,他身高矮於172厘米的概率是多少?
找概率的逐步指南
讓我們一起解決這個問題。過程總是相同的:X → Z → 概率。
第一步:識別變量。
我們已知身高的正態分佈 X,所以 $$X \sim N(165, 5^2)$$。
平均值,$$\mu = 165$$
標準差,$$\sigma = 5$$
我們感興趣的值是 $$X = 172$$。我們想找出 $$P(X < 172)$$。
第二步:將X值標準化為Z分數。
使用公式:
$$Z = \frac{X - \mu}{\sigma} = \frac{172 - 165}{5} = \frac{7}{5} = 1.4$$
所以,找出 $$P(X < 172)$$ 與找出 $$P(Z < 1.4)$$ 完全相同。
第三步:繪畫曲線(非必要但強烈建議!)。
快速畫一條鐘形曲線。中心標記為0。標記你的Z分數(1.4在0的右邊),並劃出你需要的區域。在這種情況下,你需要劃出1.4左邊的所有區域。這有助你形象化答案!
第四步:使用標準正態分佈表。
在你的表格中查找Z分數1.4。表格會給你Z分數左側的面積,這正是 $$P(Z < 1.4)$$ 的意思。
從表格中,$$P(Z < 1.4) = 0.9192$$。
因此,隨機抽選一名學生,他身高矮於172厘米的概率是 0.9192 或 91.92%。
處理不同類型的概率
-
大於 ( > )
例如,找出 $$P(X > 172)$$
我們知道曲線下的總面積是1。所以,$$P(X > 172) = 1 - P(X < 172)$$。
根據我們的計算,這是 $$1 - 0.9192 = 0.0808$$。 -
介乎兩值之間 ( < X < )
例如,找出學生身高介乎160厘米和172厘米之間的概率,即 $$P(160 < X < 172)$$。
首先,將兩個X值都轉換為Z分數。
$$Z_1 = \frac{160 - 165}{5} = -1.0$$ $$Z_2 = \frac{172 - 165}{5} = 1.4$$ 所以我們需要找出 $$P(-1.0 < Z < 1.4)$$。
邏輯是:(大Z分數左側的面積)-(小Z分數左側的面積)。
$$P(-1.0 < Z < 1.4) = P(Z < 1.4) - P(Z < -1.0)$$
使用表格和對稱性($$P(Z < -1.0) = P(Z > 1.0) = 1 - P(Z < 1.0)$$),我們得到:
$$0.9192 - (1 - 0.8413) = 0.9192 - 0.1587 = 0.7605$$
第一部分要點總結
要找出概率,務必先將你的X值轉換為Z分數。然後使用標準正態分佈表。記住,表格給出的是左側的面積。利用繪圖和「總面積 = 1」的規則來找出你需要的任何其他面積。
第二部分:從概率找數值(「逆向問題」)
現在我們把問題反過來。你會獲得一個概率(曲線下的面積),然後需要找出與之對應的特定X值。
例題:一次測驗的成績呈正態分佈,平均值為70,方差為64。要獲得「A」級成績,學生必須考入前10%。獲得「A」級成績所需的最低分數是多少?
找數值的逐步指南
這次,過程是:概率 → Z → X。
第一步:識別變量和所需面積。
成績X的分佈為 $$X \sim N(70, 64)$$。
平均值,$$\mu = 70$$
方差,$$\sigma^2 = 64 \implies$$ 標準差,$$\sigma = \sqrt{64} = 8$$。(別忘了這一步!)
我們正在尋找分數「x」,使得考獲高於它的概率是10%(即0.10)。
所以,我們需要找出「x」,其中 $$P(X > x) = 0.10$$。
第二步:繪畫曲線並找出表格可讀取的面積。
畫出鐘形曲線。「前10%」是右側很小的一塊區域。表格讀取的是左側的面積。如果我們z分數右側的面積是0.10,那麼左側的面積就是 $$1 - 0.10 = 0.90$$。
所以我們需要找出z分數,其中 $$P(Z < z) = 0.90$$。
第三步:反向使用標準正態分佈表。
在表格中查找最接近0.9000的概率值。你會找到0.8997(對應Z=1.28)和0.9015(對應Z=1.29)等值。0.8997更接近。所以,我們將使用相應的Z分數。
Z = 1.28(大約)。
第四步:將Z分數還原以找出X值。
重新排列Z分數公式以解出X:$$X = \mu + Z\sigma$$
現在,代入數值:
$$X = 70 + (1.28)(8) = 70 + 10.24 = 80.24$$
因此,獲得「A」級成績所需的最低分數是 80.24。
第二部分要點總結
要從概率找出數據值(X),首先弄清楚你所需點的左側面積。然後反向使用表格找出該面積的Z分數,再利用「還原標準化」公式 $$X = \mu + Z\sigma$$ 轉換回最終答案。
第三部分:綜合應用——文字題
這就是你展現實力的時候了!現實世界的問題不會直接說「找出P(X > 50)」。你需要閱讀題目,提取關鍵資訊,然後判斷它是「順向」還是「逆向」問題。
解題策略
- 仔細閱讀:情境是甚麼?(例如,體重、分數、時間)。
- 提取數值:平均值($$\mu$$)是甚麼?方差($$\sigma^2$$)或標準差($$\sigma$$)是甚麼?
- 確定目標:
- 你是否獲提供X值,並被要求找出概率、百分比或比例? → 這是順向問題(X → Z → P)。
- 你是否獲提供概率、百分比(如「前5%」)或比例,並被要求找出特定數值、分數或量度? → 這是逆向問題(P → Z → X)。
- 執行計劃:按照第一部分或第二部分的步驟進行。
- 回答問題:寫一個在問題情境中有意義的總結句。例如:「因此,最低體重是10.5公斤。」
你知道嗎?
正態分佈有時也被稱為高斯分佈,以著名數學家卡爾·弗里德里希·高斯的名字命名,他曾廣泛使用它。然而,它最初是由亞伯拉罕·棣莫弗發現,作為二項分佈的近似值。這說明即使在數學中,偉大的思想往往是建基於前人的努力之上!
繼續練習和繪畫曲線,你就能成為解決這些問題的高手。祝你好運!