在我們生活中 時常出現兩種事物是否有關的問題 例如個人的體重與血壓 學生的讀書時間和成績 某人的身高與鞋子大小 廣告費用與銷售量等 我們要如何考量 兩個變數之間的關聯性呢 這個單元將和同學介紹散布圖的繪製與概念 首先先讓我們來看一道例子 骨質密度是評估骨質量的一個重要標誌 指的是骨骼中單位面積所含有的礦物質 下表蒐集了8 筆有關女性年齡與骨質密度的數據 試以年齡作為x軸 骨質密度作為y軸 繪製在直角坐標上 解答 以x坐標表示年齡 y坐標表示骨質密度 選取適當刻度後 將兩個變量畫在坐標平面上 即可得散布圖如下 由上圖我們可以看出 這8筆數據有隨著年齡越大 骨質密度越少的趨勢 從上面的例子我們可以得知 如果我們要客觀的分析剛剛的資料 可以把其中一種事物數值當作x值 另一種事物的數值當作y值 並且將對應的畫在坐標平面上 而這個繪製出來的圖形就稱為散布圖 透過散布圖上所有點的分布趨勢 可以觀察X與Y是否呈現某種關聯 觀察上面例子的散布圖 我們發現 年齡與骨質密度有隨著年齡越大 而骨質密度越小的趨勢 也就是點的分布 由左上往右下傾斜的趨勢時 我們就說年齡與骨質密度呈負相關 如果這些點的分布 有由左下往右上傾斜的趨勢 這樣的情形我們說這兩組呈正相關 例如左邊的圖顯示X與Y為正相關 第二個圖顯示為X與Y為負相關 右邊的兩個圖顯示 如果這些點的分布成上下左右的對稱狀態 或各點完全分布在水平線或鉛垂線上 即表示X值的增減變化 與Y值的增減變化互不影響 我們稱這兩組資料成零相關 但是這樣界定的相關 是在描述X與Y以直線趨勢相關的程度 例如最右邊的圖中 X與Y彼此也可能有相關 但不是本單元所說的直線相關 從上面可得知 如果X與Y相關 我們知道X Y會大致上同時增減 或一增一減 但是其中一個增加 是否是造成另一個增或減的原因呢 其實啊 相關性不一定有因果關係 現在讓我們來看下面的例子吧 例題 酷課大學的數學系申請入學第二階段 共計有10位考生參加 其資料審查分數滿分為100分 上表是兩位評審委員打的分數 根據兩位評審打出的分數分別為 一直到 繪製而成的散布圖如上 雖然X與Y兩位評審給的分數 大致上有同時增或減的趨勢 但並不表示一位評審給高分 會是另一位評審給高分的原因 有可能是考生的表現才是原因 故相關性不一定有因果關係 最後整理一下今天學到的知識 在這個單元中我們知道了 可以透過散布圖上所有點的分布趨勢 來觀察X與Y是否呈現某種關聯性 但是這樣界定的關聯性 是在描述X與Y以直線趨勢相關的程度 而此兩個數據之間相關的程度 不一定代表他們是有因果關係的喔 同學們都理解了嗎