在前一個單元中 我們曾經舉了一個例子 有一食品製造商想推出一款新的鳳梨酥 在一份市場商品調查報告中 廠商得到鳳梨酥每盒的單價 與市場需求量的調查表如下 其相關係數為-5分之4 那麼同學知道這個數字代表什麼意義嗎 這個單元將和同學們來介紹 相關係數的性質 同時也將和同學們說明 這個數字代表的意義喔 我們先來觀察下列幾張圖 和相關係數r的關係 首先我們分別將四組數據的資料 繪製成散布圖 並計算它們的相關係數 從圖形中我們可以發現 當 r=1的時候 我們可以發現資料都在同一條斜率為正的直線上 當 0<r<1的時候 隨著r的值愈大 資料分布越會呈現左下右上的趨勢 且資料的分布愈靠近於某一條斜率為正的直線 所以當相關係數r為正的時候 兩個變量大致呈現 一起增加或一起減少的狀況 故稱為正相關 接下來我們再來看另外四張圖 當 r=-1 的時候 資料都在同一條斜率為負的直線上 當-1<r<0 的時候 r的絕對值愈大 代表資料分布大致會呈現左上右下的趨勢 而且資料的分布 愈靠近於某一條斜率為負的直線 所以當相關係數r為負的時候 兩個變量大致呈現一增一減的現象 故稱為負相關 然而下面的這四張圖的分布 呈現左右對稱 上下對稱 或者完全落在一條水平直線 或鉛垂直線上 它們的相關係數都是0 代表X與Y之間的關係 不會是一條正斜率或負斜率的關係 但是同學要注意 相關係數等於0 不代表它們沒有關係喔 我們只能知道它們的關係 不會是一條正斜率或負斜率的直線關係而已 根據上述的討論 當r的絕對值愈接近1時 相關程度愈高 當r的絕對值愈接近0時 相關程度愈低 我們可以從上述的幾個例子發現 歸納出來的性質是具有一般性的 一般而言相關係數具備以下幾個性質 r>0 表示兩變量為正相關 r<0 為負相關 r=0 為零相關 表示兩變量沒有直線相關性 但不排除有其他曲線相關性 r的範圍為-1≤r≤1 r=1時 散布圖中各點恰落在一條斜率為正的直線上 表示兩變量為完全正相關 r=-1時 散布圖中各點恰落在一條斜率為負的直線上 表示兩變量為完全負相關 r的絕對值愈大 表示兩變量的相關程度愈強 表示散布圖越接近一條斜直線 例題 將下列各散布圖的相關係數 r r r r 由大到小排列 解答 圖形上可以得知 第4個散布圖呈現左下右上的型態 因此r >0 第2個散布圖呈現對稱型態 因此r =0 第1個和第3個散布圖 呈現左上右下的型態 因此r r 均<0 而且第3個散布圖資料的分布 比較靠近某一條斜率為負的直線 所以r <r <0 根據上述我們可以得知 r <r <r <r 最後回到我們一開始的例子 有一食品製造商想推出一款新的鳳梨酥 在一份市場商品調查報告中 廠商得到鳳梨酥每盒的單價 與市場需求量的調查表如下 其相關係數為-5分之4 從相關係數為-5分之4我們可以得知 當單價訂的越高的時候 市場的需求量就下降了 而且這樣的相關程度很高 最後讓我們整理一下 今天學到關於相關係數的性質 相關係數已經被廣泛的應用在 各類的研究報告中 例如吸菸量與罹肺癌率 腰圍與心血管疾病發生率 都是正相關的例子 而玩手機遊戲的時間與學業成績 則呈現負相關 但是同學們要注意的是 即使兩個變量的相關係數很高 這兩個變量也不一定有因果關係 打個比方來說 常常熬夜的人喝咖啡的比例就會提高 因為需要喝咖啡提神 而常常熬夜的人 身體容易出狀況 得癌症的比例也會提高 因此咖啡因的攝取量與癌症罹患率 有很高的相關係數 但是我們不能做喝咖啡容易得癌症的推論 相關係數只能顯現 兩變量之間的線性關係程度的高低 同學們必須對整體狀況有進一步的了解之後 才能下定論 同學們都學會了嗎