在上個單元中 我們利用最小平方法 找出y對x的迴歸直線 但是當數據很多的時候 用這樣的方法求最適直線方程式 計算量就會相當的大 因此為了簡化計算 這個單元我們先求已經標準化過的兩組數據 X與Y的迴歸直線 首先我們先假設有三組標準化數據 其標準化數據Y' 對標準化數據X'的迴歸直線為L y'=mx'+k 由於兩組數據X'與Y'是標準化數據 因此它們的平均數μ μ 均為0 標準差σ σ 均為1 並且得到下列結果 根據最小平方法 我們的目標是要求S的最小值 將S化簡 因為k平方大於等於0 所以S最小值一定發生在k等於0時 取k等於0得 再經由配方法可得 故知m等於r k等於0時 S有最小值 由此我們得到標準化數據 之迴歸直線方程式為 y'=rx' 其中r為X'與Y' 亦為X與Y的相關係數 得到未標準化的迴歸直線為 由上可知此迴歸直線通過 而且斜率為r乘以σ 分之σ 再將標準差σ σ 以及相關係數r的定義代入 可得斜率等於 因此我們也可以利用上述的方法推得 接下來讓我們看下面的這個例子 下表為酷課學園種植香蕉 每公頃使用肥料量X 與香蕉產量Y的關係 第一題試求y對x的最適直線方程式 第二題試由上題推測 若酷課學園每公頃施肥量為350公斤 則產量約為多少公斤 四捨五入取到整數位 解答第一題 首先我們先計算求得算術平均數 μ =340 μ =7250 接著根據迴歸直線公式 最後我們再將上面求得的結果 代入迴歸直線的公式 便可求得迴歸直線方程式為 y減7250等於11200分之24000 乘上括號x減340 化簡後可以得到 y減7250等於7分之15 乘上括號x減340 第二題將x等於350代入最適直線方程式 可以求得y約等於7271 因此當每公頃施肥量為350公斤時 可得產量約為7271公斤 最後讓我們整理一下 今天學到關於迴歸直線的知識 在這一小節中 我們介紹了最適直線 迴歸直線方程式的計算方式 當我們知道兩變量之間 可能有線性關係存在的時候 就可利用最適直線 來描述它們的關聯性 而當求得y對x的最適直線後 通常會使用此直線方程式作為模型 觀察在x變量改變的情形下 y變量的變化 以作為預測與決策的根據 同學們都學會了嗎