數據處理與分析:助你成為數據達人嘅指南!
各位同學好!歡迎來到資訊及通訊科技最實用、最有力量嘅課題之一:數據處理與分析。有冇諗過企業點樣預測你下一個會買啲咩?又或者科學家點樣從海量實驗數據中搵到意義?答案都係有效咁處理數據。
喺呢一章,我哋將會揭開兩種神奇工具嘅奧秘:試算表同資料庫。試算表就好似你嘅超級計算器兼整理工具,而資料庫就係你井然有序嘅數碼圖書館。學習呢啲技能唔單止可以幫你考試攞高分,對你未來嘅學習同事業都極之有用。咁就事不宜遲,一齊嚟學啦!
第一部份:精通試算表
試算表係一種應用程式,等你可以將數據儲存、整理同計算喺一個由儲存格組成嘅網格入面。佢哋用途廣泛,由管理你嘅零用錢,以至分析企業銷售數據都得。
1.1 試算表嘅基本構成要素
等我哋嚟認識吓佢嘅基本部件。唔使擔心,佢比你想像中簡單㗎!
- 儲存格 (Cell):網格入面嘅一個方格。每個儲存格都有獨特嘅地址,例如A1、B2、C3。
- 列 (Row):一行橫向嘅儲存格,以數字編號1、2、3...。
- 欄 (Column):一行縱向嘅儲存格,以字母編號A、B、C...。
- 工作表 (Worksheet):單一頁面或儲存格表。一個檔案入面可以有多張工作表。
- 公式 (Formula):輸入到儲存格中嘅計算或指令。所有公式都必須以等號 (=) 開頭。
重點概念:儲存格參照
呢個超重要㗎!儲存格參照就係你點樣話畀公式知要睇邊個儲存格。想像吓佢就好似畀方向指示咁。
1. 相對參照 (Relative Reference) (例如:A1)
呢個係預設值。當你複製包含相對參照嘅公式時,佢會根據新位置而改變。
例子:試想像你畀朋友方向:「向前行兩條街,再向右轉一條街到間屋。」如果你喺一個新嘅起點畀同樣嘅方向,佢哋就會去到另一間屋!
實例:如果你喺儲存格C1有公式`=A1+B1`,當你將佢複製到儲存格C2時,佢會自動變成`=A2+B2`。呢個非常有用㗎!
2. 絕對參照 (Absolute Reference) (例如:$A$1)
呢種參照係鎖定咗嘅,當你複製公式時唔會改變。美元符號 ($) 就係個鎖嚟㗎!
例子:呢個就好似畀一個特定、固定嘅地址:「去主街123號。」無論你從邊度出發,目的地永遠都係主街123號。
實例:想像你喺儲存格H1有個固定嘅5%消費稅率 (GST rate)。要計算唔同商品嘅稅款,你嘅公式可能係`=A2 * $H$1`。當你向下複製呢個公式時,`A2`會變成`A3`、`A4`等等,但`$H$1`會一直鎖定喺消費稅率嗰度。
快速溫習欄
- 相對 (A1):複製時會改變。
- 絕對 ($A$1):複製時會鎖定,保持不變。
- 記憶小貼士:將 $ 符號想像成一塊好重嘅石頭,佢阻止咗參照移動!
1.2 公式同函數:運作嘅大腦
公式可以讓你執行計算。函數只不過係預設嘅快捷公式,令你嘅工作更輕鬆。
公式中嘅運算子
呢啲你喺數學堂已經學過大部份啦!
- 數學運算子:`+` (加)、`-` (減)、`*` (乘)、`/` (除)
- 關係運算子:呢啲會比較兩個數值,並得出真 (TRUE) 或假 (FALSE) 嘅答案。
`=` (等於)、`>` (大於)、`<` (小於)、`>=` (大於或等於)、`<=` (小於或等於)、`<>` (不等於)。
例子:如果A1中嘅值大於50,`=A1 > 50`將會顯示TRUE (真),否則會顯示FALSE (假)。 - 邏輯運算子:用於組合多個條件。
`AND(條件1, 條件2)`:只有當所有條件都為真時,先會返回TRUE (真)。
`OR(條件1, 條件2)`:只要至少一個條件為真時,就返回TRUE (真)。
基本函數
呢啲將會係你喺試算表入面嘅最佳拍檔。
- SUM(範圍):將儲存格範圍內所有數字加總。例如:`=SUM(A1:A10)`
- AVERAGE(範圍):計算數字嘅平均值。例如:`=AVERAGE(B1:B10)`
- COUNT(範圍):計算有幾多個儲存格包含數字。例如:`=COUNT(C1:C10)`
- MAX(範圍):搵出最高值。例如:`=MAX(D1:D10)`
- MIN(範圍):搵出最低值。例如:`=MIN(E1:E10)`
- IF(條件, 如果為真則返回值, 如果為假則返回值):呢個係一個強大嘅決策工具!佢會檢查一個條件係咪為真,如果係就執行一件事,如果係假就執行另一件事。
真實例子:要檢查學生是否合格 (分數 >= 50),你可以用:`=IF(A2>=50, "合格", "不合格")`。
第1.1及1.2節重點重溫
試算表係由具有獨特地址嘅儲存格構成。我哋會喺公式 (以`=`開頭) 同函數中使用呢啲地址 (儲存格參照) 嚟執行計算。掌握絕對 (`$A$1`) 同相對 (`A1`) 參照係提升工作效率嘅關鍵!
1.3 處理數據
一旦你擁有了數據,就需要將佢整理好,先可以搵到你想要嘅嘢。呢個就係數據處理!
- 排序 (Sorting):將數據按特定順序排列 (例如:A-Z,由小到大)。你可以進行單一條件排序 (例如:按學生姓名排序),亦可以進行多重條件排序 (例如:先按班級排序,再按學生姓名排序)。
- 篩選 (Filtering):暫時隱藏你唔想睇嘅列,等你可以專注於重要嘅數據。例子:喺所有學生嘅名單中,你可以篩選,淨係顯示5A班嘅學生。
- 搜尋 (Searching):喺工作表入面搵特定嘅文字或數字。通常用「尋找」指令 (Ctrl+F) 嚟完成。
- 使用多個工作表 (Using Multiple Worksheets):你可以在同一個檔案中嘅唔同工作表 (例如:「1月銷售」、「2月銷售」) 嚟整理數據。你甚至可以用公式將佢哋連結起嚟!要參照名為「Summary」工作表上嘅A1儲存格,你會寫`Summary!A1`。
第1.3節重點重溫
排序、篩選同搜尋係管理大量數據嘅強大技巧。佢哋唔會刪除你嘅數據;只係改變你檢視數據嘅方式,幫助你快速搵出洞察。
1.4 進階分析:從數據中發掘故事
而家講吓啲真正有型嘅嘢!呢啲工具可以幫助你分析數據並做出預測。
「假設」情境分析 ("What-If" Scenarios)
呢個係一種過程,透過改變儲存格中嘅數值,嚟觀察呢啲改變點樣影響公式嘅結果。佢就好似問「如果…會點?」
例子:你為學校活動有預算。你可以用「假設」情境分析,嚟睇吓如果零食價格上升,或者參加人數減少,總成本會有咩變化。佢可以幫助你為唔同嘅可能性做規劃。
樞紐分析表同樞紐分析圖 (Pivot Tables and Pivot Charts)
如果一開始覺得佢好難,唔使擔心!一個樞紐分析表係一個神奇嘅工具,等你可以互動式地匯總、重新組織同分析大量數據,而唔會改變你嘅原始數據。
例子:想像你有一個裝滿咗各種樂高積木嘅大箱 (你嘅數據)。樞紐分析表就好似一部神奇嘅機器,可以即時按顏色、形狀或大小分類同計算積木,並向你顯示一個結果摘要表。你可以隨時改變主意,要求佢按唔同屬性排序,佢都會喺一秒鐘內做到!
運作方式 (簡單版):
- 你從一個原始數據表開始 (例如:銷售交易清單)。
- 你插入一個樞紐分析表。
- 你會得到一個控制面板,上面有你嘅數據欄 (欄位) 同四個區域:
- 列 (Rows):將欄位拖曳到呢度,以創建列標籤 (例如:產品類別)。
- 欄 (Columns):將欄位拖曳到呢度,以創建欄標籤 (例如:地區)。
- 值 (Values):將你想要計算嘅欄位拖曳到呢度 (例如:銷售金額)。佢通常會預設為加總 (SUM) 或計數 (COUNT)。
- 篩選器 (Filters):將欄位拖曳到呢度,以篩選整個表格 (例如:年份)。
一個樞紐分析圖只不過係一個連結到樞紐分析表嘅圖表。當你更改樞紐分析表時,圖表會自動更新,為你提供數據嘅視覺化摘要。
第1.4節重點重溫
「假設」情境分析透過改變輸入嚟幫助你做出預測。樞紐分析表係快速匯總龐大數據集嘅終極工具。佢哋將混亂嘅表格轉化為清晰、有意義嘅摘要。
第二部份:認識資料庫
當你嘅數據變得非常龐大同複雜時會點呢?試算表可能會變得好慢同埋一團糟。呢個時候,我哋就需要資料庫啦!
例子:試算表就好似一張單一大紙,你喺上面寫晒所有嘢。資料庫就好似一個井然有序嘅文件櫃,有好多個抽屜 (資料表),每個文件 (記錄) 都以結構化嘅方式儲存,而且你可以輕鬆搵到並連結相關資訊。
2.1 建立簡單資料庫
資料庫將數據儲存喺一個或多個資料表入面。我哋嚟重溫吓基本術語:
- 資料庫 (Database):你數據嘅整個容器 (文件櫃)。
- 資料表 (Table):以行同欄組織嘅相關數據集合 (文件櫃中嘅一個抽屜)。一個資料庫可以有多個資料表,佢哋可以互相連結。
- 記錄 (Record):資料表入面嘅單一行。佢包含關於一個項目嘅所有資訊 (抽屜入面嘅一個文件)。例子:一位學生嘅完整資料。
- 欄位 (Field):資料表入面嘅單一欄。佢代表一個項目嘅一小塊資訊 (表格上嘅一個方格,例如「名字」)。
使用表單輸入數據
直接將數據輸入到資料表可能會導致錯誤。表單係一個用戶友好嘅視窗,等你可以一次輸入或查看一條記錄。
例子:當你註冊網站時,你會填寫一個清晰、簡單嘅表單。你唔會直接將你嘅資訊輸入到公司龐大嘅用戶資料表入面!表單更安全、更易用,並有助於防止錯誤。
第2.1節重點重溫
資料庫將數據組織成相互連結嘅資料表。每個資料表由記錄 (行) 同欄位 (列) 組成。我哋使用表單令數據輸入變得簡單可靠。
2.2 使用查詢提出問題
查詢只不過係你向資料庫提出嘅一個問題,用嚟搵出特定資訊。呢個係資料庫最強大嘅功能!
例子:你行去圖書館問圖書館管理員:「你可唔可以搵晒所有艾西莫夫寫嘅科幻小說?」呢個問題就係一個查詢。圖書館管理員畀你嘅書單就係查詢結果。
查詢可以讓你執行三個主要操作:
- 選擇與篩選 (Selection & Filtering):根據條件選擇要顯示嘅記錄。(例如:「顯示所有考試分數 > 80分嘅學生」)。
- 排序 (Sorting):對結果進行排序。(例如:「...並按姓名嘅字母順序排列」)。
初探SQL:資料庫嘅語言
資料庫明白一種特殊語言,叫做SQL (結構化查詢語言)。你只需要能夠閱讀並理解簡單嘅SQL語句。等我哋嚟拆解一下。
想像我哋有一個叫Students嘅資料表。
`SELECT StudentName, Class`
`FROM Students`
`WHERE City = 'Hong Kong'`
`ORDER BY StudentName;`
佢一步步嘅意思如下:
- SELECT StudentName, Class: 「淨係顯示『學生姓名』同『班級』欄位。」
- FROM Students: 「...從『Students』資料表。」
- WHERE City = 'Hong Kong': 「淨係包含『城市』欄位係『Hong Kong』嘅記錄。」(呢個就係篩選啦!)
- ORDER BY StudentName: 「並將最終結果按學生姓名嘅字母順序排序。」
睇吓?佢只不過係一個好有結構嘅提問方式!
第2.2節重點重溫
查詢係一個用嚟檢索特定數據嘅問題。佢讓你從一個或多個資料表中選擇、篩選同排序資訊。簡單嘅SQL語句就係呢啲查詢背後嘅程式碼。
2.3 建立專業報告
雖然查詢會畀你原始數據,但報告係一種將數據以精美、格式化同易於閱讀嘅文件形式呈現嘅方式。
例子:查詢結果係一堆混亂嘅數字同文字列表。報告就係一張精美、打印出嚟嘅學校成績表,有適當嘅標題、標題同摘要,你可以交畀你父母。
報告係為觀眾而設計嘅。佢哋可以包含:
- 標題、頁碼同日期。
- 按類別分組嘅數據 (例如:按班級將學生分組)。
- 計算,例如總計或平均值 (例如:顯示每個班級嘅平均分數)。
第2.3節重點重溫
報告將來自資料表或查詢嘅原始數據轉化為專業、格式化嘅文件,令大家更容易理解。佢嘅重點就係清晰嘅呈現。
本章總結
恭喜你!你已經掌握咗數據處理嘅核心技巧。
喺試算表中,我哋使用公式同函數嚟執行計算。我哋透過排序同篩選處理數據,並使用樞紐分析表等強大工具嚟匯總同分析數據。
喺資料庫中,我哋將複雜嘅數據組織到資料表入面。我哋使用查詢 (SQL) 嚟提出問題並提取特定資訊,並使用報告以清晰專業嘅方式呈現該資訊。
呢啲工具喺現代世界無處不在。繼續練習,你就會成為一個數據專家㗎啦!你一定得嘅!