數據分析是現代公民生活所必備的素養 例如 內政部想要調查男性和女性的平均壽命 於2020年8月5日公布了 2019年簡易生命表 國人的平均壽命為80.9歲 其中男性77.7歲 女性84.2歲 皆創歷年新高 究竟什麼是平均壽命呢 這些數據又代表什麼意義呢 這個單元將帶大家認識什麼是一維數據 並且跟大家介紹幾個生活中用來分析一維數據的常見指標 包含眾數 中位數 以及算術平均數 什麼是一維數據呢 一維數據指的是只有一個變量的數據 例如:身高 體重 年齡 數學成績 營業額等 而我們經常會用單一的數值 來代表這個變量數據的中心點或數據的集中情形 常用的數值有眾數 中位數 算術平均數 加權平均數與幾何平均數 在這個單元中 我們將介紹眾數 中位數 以及算術平均數 根據一開始內政部公布的2019年簡易生命表中提到的平均壽命 什麼是平均壽命呢 平均壽命又是如何計算出來的呢 一組數據的算術平均數 簡稱平均數 就是所有數據的總和除以此組數據的個數所得到的值 我們會記作 μ 也就是 當有n個數據為 X1 X2一直到Xn時 其算術平均數 簡稱平均數為 μ等於n分之X1加X2一直加到Xn 接下來讓我們看一個例子 因應時代趨勢 很多人在找尋美食餐廳時 都會上網搜尋餐廳的評價 因此都會上網google一下評價 以下是某餐廳的評價 試求其評價分數的算術平均數為幾顆星 答案為 因為總和為 5乘以351加4乘以280加3乘以130加2乘以134加1乘以86 等於3619 3619除以括號351加280加130加134加86 約等於3.69 所以評價分數是3.69 從上述的例子 我們可以得知平均數是所有數值資料的平均 因此很容易受到資料中特別大或特別小的極端值所影響 例如 我們收到的資訊是 在一次聚餐中 參加的 9 個人平均年齡是 17 歲 大家會認為這是什麼族群的聚餐呢 我們可能會認為這是一個高中生的同學聚餐 但是結果發現 這 9 個人的年齡分別是 13 13 13 13 14 14 15 15 43 歲 跟原本的認知完全就不一樣了 其中 43 是影響平均年齡的極端值 但是 如果將這 9 筆資料由小排到大 取最中間的資料 14歲 就比較適合代表這群人的年齡 我們稱一組資料由小排到大最中間位置的數值為中位數 在上面的例子中 這 9 筆資料最中間位置是第 5 筆 如果是 10 筆資料 則最中間位置的數據會有兩筆 分別是第 5 筆及第 6 筆資料 我們規定中位數是這兩筆資料的平均 所以我們可以先把上面的資訊整理 先將 n 筆數值資料由小到大依序排列 若 n 是奇數 則中位數是第2分之n加1筆資料 若 n 是偶數 則中位數是 第2分之n與第2分之n加1筆資料的平均 接下來 讓我們看個例子 酷課籃球隊有 15 位隊員 每人投籃 6 次 進球數如畫面 求進球數的中位數 答案為 因為 15 是奇數 所以中位數是由小排到大的第2分之15加1 等於第 8 筆資料 即中位數等於2 故進球數的中位數為 2 球 一般而言 連鎖量販店常常會記錄 哪一個廠牌或哪一種型號的物品最暢銷 藉此作為下次進貨的依據 他們會統計一組數值資料 看看哪些資料出現的次數最多 其中出現次數最多的數值資料 稱為這群資料的眾數 如果出現次數最多的資料有 2 種以上 含 2 種 則這幾種都是眾數 眾數也能呈現一組資料的特性 現在讓我們來看一個例子 高中某班上的男同學球鞋的尺寸號碼 美國標準 如下表 則此班上男同學球鞋尺寸號碼的眾數是幾號 從表中可知這個班上男同學球鞋的尺寸號碼 最多次的是 8 號與 8.5 號 故眾數是 8 號與 8.5 號 眾數是一組數據中出現次數最多的數據 是一組數據中的原數據名稱 而不是相對應的次數 例如上述的球鞋尺寸問題 眾數是 8 號與 8.5 號 而非5次