從前面的單元課程中 我們知道可以利用平均數與中位數 來了解一組資料的集中程度 但是對於資料的特性 單靠平均數與中位數卻略嫌不足 百分位數雖然能提供一筆數據 更詳細的位置資訊 在資料稀疏的區域 百分位數能進一步的看出 這個區域的散布情形 但是在資料集中區 百分位數會擠在一起 反而看不出規則或現象 因此我們還需要其他方法 來分析數值分布的情形 這個單元將介紹四分位數的概念與意義 現在讓我們舉個例子來說 現有甲資料20筆 1 2 2 4 5 6 7 8 9 10 11 12 14 14 15 16 17 18 19 20 平均數是10.5 中位數是10.5 乙資料20筆 1 1 1 1 1 3 3 3 3 3 18 18 18 18 18 20 20 20 20 20 平均數是10.5 中位數是10.5 雖然以上這兩組資料的平均數與中位數皆相同 但仔細觀察 兩筆數值的差異卻非常大 此時我們可能需要其他方法 來分析數值分布的情形 在討論數值資料的分布情形時 也可以利用資料中的第25百分位數P25 第50百分位數P50 第75百分位數P75 這三個百分位數來協助我們對資料的了解 其中P25稱為第1四分位數 簡記為Q1 P50稱為第2四分位數 簡記為Q2 也就是中位數 P75稱為第3四分位數 簡記為Q3 因此我們可以仿照百分位數的計算方式 來計算四分位數 現在就讓我們來複習一下 百分位數的計算方式吧 假設有一組資料有n筆數據 其第m百分位數Pm的算法是 先將這n筆數據由小到大排序 並計算 n×m% 當n×m%不為整數 取大於n×m%的最小整數 I 則Pm為第 I 筆數據的值 當n×m%為整數 則Pm為第 I 筆數據 與第 I+1筆數據的平均值 現在讓我們舉一個例子 某國中的三年一班共有男生17人 該班男生的身高由小排到大如表所示 試求第1四分位數 第2四分位數 以及第3四分位數 解答 根據百分位數的計算方式 17×25%=4.25 非整數 所以第1四分位數是由小排到大的第5筆資料 即160公分 17×50%=8.5 非整數 所以中位數或者第2四分位數 是由小排到大的第9筆資料 即163公分 17×75%=12.75 非整數 第3四分位數是由小排到大的第13筆資料 即170公分 事實上四分位數還有另外一個定義 將數據由小到大排序後 利用中位數將數據分成前後兩組 不要把中位數放入已分好的組別 將第1四分位數定為前面組別的中位數 而第3四分位數定為後面組別的中位數 舉個例子來說 有一筆資料為2 3 4 5 6 這筆資料的中位數是4 我們可以利用4將數據分成2 3與5 6兩組 根據上面的定義 第1四分位數即為2 3的中位數 也就是2.5 而第3四分位數為5 6的中位數 也就是5.5 最後整理一下今天學到的知識 從上述的課程中可知 雖然第1四分位數可以定義為 中位數前所有數據的中位數 而第3四分位數則定義為 中位數後所有數據的中位數 這種四分位數的計算 與前面由百分位數定義出來的 四分位數數值可能略為不同 但是從統計學計算大量數據的觀點來看 這兩種計算四分位數的方式 所計算出來的差距相差甚微 在實用上並不會影響 同學們都學會了嗎