假設有X1、X2、X3三個預測變量(變量或稱變項、變數),Y為效標變量(依變量)。
其中X1與Y的相關最高(設為0.9),所以是最重要的變量。
X2分別與X1及Y都有高相關(設為0.8),是第二重要的變量,但是X2與X1有共線問題。
X3分別與X1及Y都有低相關(設為0.2),所以X3是不重要的變量,但是X3與X1沒有共線問題。
如果用逐步迴歸,則選入的變數可能是X1與X3,
X2因為與X1有高相關(共線),因此被剔除了。
X3能進入,主要得利於X1先進入方程式,X2就無法進入。
如果自行選擇重要的變量(或是進行三次簡單相關),
則可能是X1與X2進入模式(因為與Y的相關較高),X3因為與Y的相關最低,因而被剔除。
所以,使用不同的方法,得到的結果就不同。
逐步迴歸雖然可以解決多元共線性的問題,
但是,最後得到的預測變數,不見得就是重要的變數。
最後,如果使用X1與X3預測Y,解釋量可能比較高,
而使用X1與X2預測Y,解釋量反而較低。


雷达卡
京公网安备 11010802022788号







