建立回归模型之一模型的选择与验证-第一文库 | 海量文档资源下载与分享平台

免费试读已结束，剩余 28 页请下载文档后查看

10 金币

下载此文档

/ 38

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

9.1建模程序概觀資料蒐集實驗控制具有共變異的實驗控制確定性的觀察研究探索性的觀察研究資料準備模型預選之研究減少解釋變數實驗控制具有共變異的實驗控制確定性的觀察研究探索性的觀察研究模型精煉與選擇模型驗證9.2外科單位案例9.3選擇模型之準則假設子集中納入的預測變數有p–1個，此一迴歸函數將有p個參數，同時(9.1)另外必須假設觀測值的個數必然大於最大的潛在參數個數：(9.2)或SSEp準則準則相當於採用誤差平方和SSEp當作評估準則，在SSEp準則下，SSEp越小表示該子集越好，兩者的等價性源自於(6.40)：(9.3)或MSEp準則由於的計算過程並未利用到迴歸模型的參數個數，且當參數個數p增加時，max()並不會因此而減少，所以可以根據(6.42)，另外定義一種經調整過的複判定係數準則：(9.4)Mallows’Cp準則此一準則係根據每一個被考慮的子集，其n個配適值的總均方誤差而定，均方誤差的概念與每一個配適值的總誤差有關：(9.5)總誤差是由一個偏誤成份加上一個隨機誤差成份所組成：1.第i個配適值的偏誤成份又稱為模型誤差成份，定義為：(9.5a)其中，是在給定模型下第i個配適值的期望值，當配適值不正確時，將與真實平均反應值不同，其差距則代表模型的配適偏誤。2.的隨機誤差成份定義為：(9.5b)上式代表給定樣本其配適值與本身期望值之離差，此處的期望值是以同一個迴歸模型下，配適出所有可能的樣本，所得到的第i個配適值之平均。根據(9.5)可以定義出均方誤差，透過：上式取期望值後為：(9.6)其中，代表配適值的變異數。因此n個配適值的總均方誤差為：(9.7)我們用符號表示此一準則量，然後將(9.7)的總均方誤差除以真實的誤差變異數：(9.8)假設在所有P–1個潛在的預測變數均為經過仔細考慮下應納入的變數，則MSE(X1,…,Xp-1)為的不偏估計量，而可以證明出的估計量為：(9.9)其中，SSEp為配適了p個參數後的迴歸模型之誤差平方和，當p–1個X變數之迴歸模型沒有偏誤時，，則此時Cp的期望值將接近p：(9.10)AICp與SBCp準則主要是用以判斷新增的預測變數是否適當，其定義如下：(9.14)(9.15)PRESSp準則第i個個案的PRESS預測誤差為：(9.16)而PRESSp準則是指n個個案之平方預測誤差總和，(9.17)9.4選擇模型的自動搜尋程序逐步迴歸法前進逐步迴歸1.逐步迴歸習慣上是先對所有的P–1個潛在X變數，一一配適簡單線性迴歸模型，在每一個簡單線性迴歸模型中，透過t*統計量(2.17)來一一檢定斜率是否為零：(9.18)3.在我們的例題中，只有變數X7需要被考慮剔除，所以僅需使用一次t*統計量：(9.19)在逐步迴歸重複不斷進行的過程中，統計量將可能會出現多個，這時我們將優先剔除具有最小統計量的變數，或是等價關係中最大P-值的變數。其他逐步程序前進選擇法後退消去法9.5關於選擇模型的自動搜尋程序最後幾點說明9.6模型驗證重複研究的困難理論、實證與模擬之比較資料切割