數據處理與分析:助你成為數據達人嘅指南!

各位同學好!歡迎來到資訊及通訊科技最實用、最有力量嘅課題之一:數據處理與分析。有冇諗過企業點樣預測你下一個會買啲咩?又或者科學家點樣從海量實驗數據中搵到意義?答案都係有效咁處理數據。

喺呢一章,我哋將會揭開兩種神奇工具嘅奧秘:試算表資料庫。試算表就好似你嘅超級計算器兼整理工具,而資料庫就係你井然有序嘅數碼圖書館。學習呢啲技能唔單止可以幫你考試攞高分,對你未來嘅學習同事業都極之有用。咁就事不宜遲,一齊嚟學啦!




第一部份:精通試算表

試算表係一種應用程式,等你可以將數據儲存、整理同計算喺一個由儲存格組成嘅網格入面。佢哋用途廣泛,由管理你嘅零用錢,以至分析企業銷售數據都得。

1.1 試算表嘅基本構成要素

等我哋嚟認識吓佢嘅基本部件。唔使擔心,佢比你想像中簡單㗎!

  • 儲存格 (Cell):網格入面嘅一個方格。每個儲存格都有獨特嘅地址,例如A1、B2、C3
  • 列 (Row):一行橫向嘅儲存格,以數字編號1、2、3...
  • 欄 (Column):一行縱向嘅儲存格,以字母編號A、B、C...
  • 工作表 (Worksheet):單一頁面或儲存格表。一個檔案入面可以有多張工作表。
  • 公式 (Formula):輸入到儲存格中嘅計算或指令。所有公式都必須以等號 (=) 開頭。
重點概念:儲存格參照

呢個超重要㗎!儲存格參照就係你點樣話畀公式知要睇邊個儲存格。想像吓佢就好似畀方向指示咁。

1. 相對參照 (Relative Reference) (例如:A1)
呢個係預設值。當你複製包含相對參照嘅公式時,佢會根據新位置而改變。
例子:試想像你畀朋友方向:「向前行兩條街,再向右轉一條街到間屋。」如果你喺一個新嘅起點畀同樣嘅方向,佢哋就會去到另一間屋!
實例:如果你喺儲存格C1有公式`=A1+B1`,當你將佢複製到儲存格C2時,佢會自動變成`=A2+B2`。呢個非常有用㗎!

2. 絕對參照 (Absolute Reference) (例如:$A$1)
呢種參照係鎖定咗嘅,當你複製公式時唔會改變。美元符號 ($) 就係個鎖嚟㗎!
例子:呢個就好似畀一個特定、固定嘅地址:「去主街123號。」無論你從邊度出發,目的地永遠都係主街123號。
實例:想像你喺儲存格H1有個固定嘅5%消費稅率 (GST rate)。要計算唔同商品嘅稅款,你嘅公式可能係`=A2 * $H$1`。當你向下複製呢個公式時,`A2`會變成`A3`、`A4`等等,但`$H$1`會一直鎖定喺消費稅率嗰度。

快速溫習欄

- 相對 (A1):複製時會改變。
- 絕對 ($A$1):複製時會鎖定,保持不變。
- 記憶小貼士:$ 符號想像成一塊好重嘅頭,佢阻止咗參照移動!

1.2 公式同函數:運作嘅大腦

公式可以讓你執行計算。函數只不過係預設嘅快捷公式,令你嘅工作更輕鬆。

公式中嘅運算子

呢啲你喺數學堂已經學過大部份啦!

  • 數學運算子:`+` (加)、`-` (減)、`*` (乘)、`/` (除)
  • 關係運算子:呢啲會比較兩個數值,並得出真 (TRUE) 或假 (FALSE) 嘅答案。
    `=` (等於)、`>` (大於)、`<` (小於)、`>=` (大於或等於)、`<=` (小於或等於)、`<>` (不等於)。
    例子:如果A1中嘅值大於50,`=A1 > 50`將會顯示TRUE (真),否則會顯示FALSE (假)。
  • 邏輯運算子:用於組合多個條件。
    `AND(條件1, 條件2)`:只有當所有條件都為真時,先會返回TRUE (真)。
    `OR(條件1, 條件2)`:只要至少一個條件為真時,就返回TRUE (真)。
基本函數

呢啲將會係你喺試算表入面嘅最佳拍檔。

  • SUM(範圍):將儲存格範圍內所有數字加總。例如:`=SUM(A1:A10)`
  • AVERAGE(範圍):計算數字嘅平均值。例如:`=AVERAGE(B1:B10)`
  • COUNT(範圍):計算有幾多個儲存格包含數字。例如:`=COUNT(C1:C10)`
  • MAX(範圍):搵出最高值。例如:`=MAX(D1:D10)`
  • MIN(範圍):搵出最低值。例如:`=MIN(E1:E10)`
  • IF(條件, 如果為真則返回值, 如果為假則返回值):呢個係一個強大嘅決策工具!佢會檢查一個條件係咪為真,如果係就執行一件事,如果係假就執行另一件事。
    真實例子:要檢查學生是否合格 (分數 >= 50),你可以用:`=IF(A2>=50, "合格", "不合格")`。
第1.1及1.2節重點重溫

試算表係由具有獨特地址嘅儲存格構成。我哋會喺公式 (以`=`開頭) 同函數中使用呢啲地址 (儲存格參照) 嚟執行計算。掌握絕對 (`$A$1`) 同相對 (`A1`) 參照係提升工作效率嘅關鍵!

1.3 處理數據

一旦你擁有了數據,就需要將佢整理好,先可以搵到你想要嘅嘢。呢個就係數據處理!

  • 排序 (Sorting):將數據按特定順序排列 (例如:A-Z,由小到大)。你可以進行單一條件排序 (例如:按學生姓名排序),亦可以進行多重條件排序 (例如:先按班級排序,再按學生姓名排序)。
  • 篩選 (Filtering):暫時隱藏你唔想睇嘅列,等你可以專注於重要嘅數據。例子:喺所有學生嘅名單中,你可以篩選,淨係顯示5A班嘅學生。
  • 搜尋 (Searching):喺工作表入面搵特定嘅文字或數字。通常用「尋找」指令 (Ctrl+F) 嚟完成。
  • 使用多個工作表 (Using Multiple Worksheets):你可以在同一個檔案中嘅唔同工作表 (例如:「1月銷售」、「2月銷售」) 嚟整理數據。你甚至可以用公式將佢哋連結起嚟!要參照名為「Summary」工作表上嘅A1儲存格,你會寫`Summary!A1`。
第1.3節重點重溫

排序篩選搜尋係管理大量數據嘅強大技巧。佢哋唔會刪除你嘅數據;只係改變你檢視數據嘅方式,幫助你快速搵出洞察。

1.4 進階分析:從數據中發掘故事

而家講吓啲真正有型嘅嘢!呢啲工具可以幫助你分析數據並做出預測。

「假設」情境分析 ("What-If" Scenarios)

呢個係一種過程,透過改變儲存格中嘅數值,嚟觀察呢啲改變點樣影響公式嘅結果。佢就好似問「如果…會點?」
例子:你為學校活動有預算。你可以用「假設」情境分析,嚟睇吓如果零食價格上升,或者參加人數減少,總成本會有咩變化。佢可以幫助你為唔同嘅可能性做規劃。

樞紐分析表同樞紐分析圖 (Pivot Tables and Pivot Charts)

如果一開始覺得佢好難,唔使擔心!一個樞紐分析表係一個神奇嘅工具,等你可以互動式地匯總、重新組織同分析大量數據,而唔會改變你嘅原始數據。

例子:想像你有一個裝滿咗各種樂高積木嘅大箱 (你嘅數據)。樞紐分析表就好似一部神奇嘅機器,可以即時按顏色、形狀或大小分類同計算積木,並向你顯示一個結果摘要表。你可以隨時改變主意,要求佢按唔同屬性排序,佢都會喺一秒鐘內做到!

運作方式 (簡單版):

  1. 你從一個原始數據表開始 (例如:銷售交易清單)。
  2. 你插入一個樞紐分析表。
  3. 你會得到一個控制面板,上面有你嘅數據欄 (欄位) 同四個區域:
    • 列 (Rows):將欄位拖曳到呢度,以創建列標籤 (例如:產品類別)。
    • 欄 (Columns):將欄位拖曳到呢度,以創建欄標籤 (例如:地區)。
    • 值 (Values):將你想要計算嘅欄位拖曳到呢度 (例如:銷售金額)。佢通常會預設為加總 (SUM) 或計數 (COUNT)。
    • 篩選器 (Filters):將欄位拖曳到呢度,以篩選整個表格 (例如:年份)。

一個樞紐分析圖只不過係一個連結到樞紐分析表嘅圖表。當你更改樞紐分析表時,圖表會自動更新,為你提供數據嘅視覺化摘要。

第1.4節重點重溫

假設」情境分析透過改變輸入嚟幫助你做出預測。樞紐分析表係快速匯總龐大數據集嘅終極工具。佢哋將混亂嘅表格轉化為清晰、有意義嘅摘要。




第二部份:認識資料庫

當你嘅數據變得非常龐大同複雜時會點呢?試算表可能會變得好慢同埋一團糟。呢個時候,我哋就需要資料庫啦!

例子:試算表就好似一張單一大紙,你喺上面寫晒所有嘢。資料庫就好似一個井然有序嘅文件櫃,有好多個抽屜 (資料表),每個文件 (記錄) 都以結構化嘅方式儲存,而且你可以輕鬆搵到並連結相關資訊。

2.1 建立簡單資料庫

資料庫將數據儲存喺一個或多個資料表入面。我哋嚟重溫吓基本術語:

  • 資料庫 (Database):你數據嘅整個容器 (文件櫃)。
  • 資料表 (Table):以行同欄組織嘅相關數據集合 (文件櫃中嘅一個抽屜)。一個資料庫可以有多個資料表,佢哋可以互相連結。
  • 記錄 (Record):資料表入面嘅單一行。佢包含關於一個項目嘅所有資訊 (抽屜入面嘅一個文件)。例子:一位學生嘅完整資料。
  • 欄位 (Field):資料表入面嘅單一欄。佢代表一個項目嘅一小塊資訊 (表格上嘅一個方格,例如「名字」)。
使用表單輸入數據

直接將數據輸入到資料表可能會導致錯誤。表單係一個用戶友好嘅視窗,等你可以一次輸入或查看一條記錄。

例子:當你註冊網站時,你會填寫一個清晰、簡單嘅表單。你唔會直接將你嘅資訊輸入到公司龐大嘅用戶資料表入面!表單更安全、更易用,並有助於防止錯誤。

第2.1節重點重溫

資料庫將數據組織成相互連結嘅資料表。每個資料表由記錄 (行) 同欄位 (列) 組成。我哋使用表單令數據輸入變得簡單可靠。

2.2 使用查詢提出問題

查詢只不過係你向資料庫提出嘅一個問題,用嚟搵出特定資訊。呢個係資料庫最強大嘅功能!

例子:你行去圖書館問圖書館管理員:「你可唔可以搵晒所有艾西莫夫寫嘅科幻小說?」呢個問題就係一個查詢。圖書館管理員畀你嘅書單就係查詢結果。

查詢可以讓你執行三個主要操作:

  • 選擇與篩選 (Selection & Filtering):根據條件選擇要顯示嘅記錄。(例如:「顯示所有考試分數 > 80分嘅學生」)。
  • 排序 (Sorting):對結果進行排序。(例如:「...並按姓名嘅字母順序排列」)。
初探SQL:資料庫嘅語言

資料庫明白一種特殊語言,叫做SQL (結構化查詢語言)。你只需要能夠閱讀並理解簡單嘅SQL語句。等我哋嚟拆解一下。

想像我哋有一個叫Students嘅資料表。

`SELECT StudentName, Class`
`FROM Students`
`WHERE City = 'Hong Kong'`
`ORDER BY StudentName;`

佢一步步嘅意思如下:

  • SELECT StudentName, Class: 「淨係顯示『學生姓名』同『班級』欄位。」
  • FROM Students: 「...從『Students』資料表。」
  • WHERE City = 'Hong Kong': 「淨係包含『城市』欄位係『Hong Kong』嘅記錄。」(呢個就係篩選啦!)
  • ORDER BY StudentName: 「並將最終結果按學生姓名嘅字母順序排序。」

睇吓?佢只不過係一個好有結構嘅提問方式!

第2.2節重點重溫

查詢係一個用嚟檢索特定數據嘅問題。佢讓你從一個或多個資料表中選擇、篩選同排序資訊。簡單嘅SQL語句就係呢啲查詢背後嘅程式碼。

2.3 建立專業報告

雖然查詢會畀你原始數據,但報告係一種將數據以精美、格式化同易於閱讀嘅文件形式呈現嘅方式。

例子:查詢結果係一堆混亂嘅數字同文字列表。報告就係一張精美、打印出嚟嘅學校成績表,有適當嘅標題、標題同摘要,你可以交畀你父母。

報告係為觀眾而設計嘅。佢哋可以包含:

  • 標題、頁碼同日期。
  • 按類別分組嘅數據 (例如:按班級將學生分組)。
  • 計算,例如總計或平均值 (例如:顯示每個班級嘅平均分數)。
第2.3節重點重溫

報告將來自資料表或查詢嘅原始數據轉化為專業、格式化嘅文件,令大家更容易理解。佢嘅重點就係清晰嘅呈現。



本章總結

恭喜你!你已經掌握咗數據處理嘅核心技巧。

試算表中,我哋使用公式函數嚟執行計算。我哋透過排序篩選處理數據,並使用樞紐分析表等強大工具嚟匯總同分析數據。

資料庫中,我哋將複雜嘅數據組織到資料表入面。我哋使用查詢 (SQL) 嚟提出問題並提取特定資訊,並使用報告以清晰專業嘅方式呈現該資訊。

呢啲工具喺現代世界無處不在。繼續練習,你就會成為一個數據專家㗎啦!你一定得嘅!