大家還記得在前面的單元中 我們學過了數據標準化的概念嗎 設n個數據x x 一直到x 的平均數為μ 標準差為σ σ>0 將每一個數據減去μ後再除以σ 形成一組新數據y y 一直到y 即y 等於σ分之x 減μ i=1 2一直到n 這樣的變換稱為數據標準化 那麼大家知道新的數據y y 一直到y 的 平均數以及標準差各是多少嗎 和原始數據x x 一直到x 的 平均數與標準差的關係是什麼嗎 要解決上面的問題 需要用到前面談過的 資料的伸縮與平移的概念了 現在讓我們先複習一下 資料的伸縮與平移的概念吧 設n個數據x x 一直到x 的平均數為μ 標準差為σ σ>0 將每筆資料經過伸縮與平移 y =ax +b後得到新的資料 y y 一直到y 並且假設其平均數記為μ 標準差為σ 則μ =aμ+b σ = |a|σ 現在讓我們回到標準化的問題 我們已經知道標準化後的新數據為y 因此我們可以利用數據的伸縮與平移的概念 而這種利用伸縮與平移將數據變換 並使得新數據平均數為0 標準差為1的方式 稱為數據標準化 數據標準化後的新數據又稱為標準分數 現在我們來看個例子 有一組5個數據經標準化後分別為 0.25 -0.75 1.25 0.75 -1.5 已知原來數據的平均數是60 標準差是8 寫出原來的5個數據中數值最大者為何 根據標準化的概念 標準化表示原數據x 與算術平均數相差了幾個標準差 亦即標準化後 我們可以看出原數據x 在整組數據資料中的相對位置 因此從這五個數據標準化後的數值 0.25 -0.75 1.25 0.75 -1.5 可以得知最大者為1.25 再根據標準化的定義 最大值為1.25等於8分之x 減60 也就是x =1.25×8+60=70 答案是國文科 同學們答對了嗎 我們再來看一次解答吧 再從標準化的定義 我們可以看出原數據x 在整組數據資料中的相對位置 因此阿哲的國文標準分數為0.67 在班上的表現最好 最後整理一下今天學到的知識 透過數據的伸縮與平移的概念 以及標準化的定義 我們可以得知標準化數據的算術平均數為0 標準差為1 在這個單元中 我們知道了標準化數據的算術平均數為0 標準差為1 而這個想法就是把平均數移到0 然後用標準差當尺來量 看每個數據距離0有多少個標準差喔 同學們都理解了嗎