在大多數(shù)的實際問題中,影響因變量的因素不是一個而是多個,我們稱這類回問題為多元回歸分析??梢越⒁蜃兞?span>y與各自變量xj(j=1,2,3,…,n)之間的多元線性回歸模型:
其中:b0是回歸常數(shù);bk(k=1,2,3,…,n)是回歸參數(shù);e是隨機誤差。
多元回歸在病蟲預(yù)報中的應(yīng)用實例:
某地區(qū)病蟲測報站用相關(guān)系數(shù)法選取了以下4個預(yù)報因子;x1為最多連續(xù)10天誘蛾量(頭);x2為4月上、中旬百束小谷草把累計落卵量(塊);x3為4月中旬降水量(毫米),x4為4月中旬雨日(天);預(yù)報一代粘蟲幼蟲發(fā)生量y(頭/m2)。分級別數(shù)值列成表2-1。
預(yù)報量y:每平方米幼蟲0~10頭為1級,11~20頭為2級,21~40頭為3級,40頭以上為4級。
預(yù)報因子:x1誘蛾量0~300頭為l級,301~600頭為2級,601~1000頭為3級,1000頭以上為4級;x2卵量0~150塊為1級,15l~300塊為2級,301~550塊為3級,550塊以上為4級;x3降水量0~10.0毫米為1級,10.1~13.2毫米為2級,13.3~17.0毫米為3級,17.0毫米以上為4級;x4雨日0~2天為1級,3~4天為2級,5天為3級,6天或6天以上為4級。
表2-1
數(shù)據(jù)保存在“DATA6-5.SAV”文件中。
1)準備分析數(shù)據(jù)
在SPSS數(shù)據(jù)編輯窗口中,創(chuàng)建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼蟲密度”變量,并輸入數(shù)據(jù)。再創(chuàng)建蛾量、卵量、降水量、雨日和幼蟲密度的分級變量“x1”、“x2”、“x3”、“x4”和“y”,它們對應(yīng)的分級數(shù)值可以在SPSS數(shù)據(jù)編輯窗口中通過計算產(chǎn)生。
或者打開已存在的數(shù)據(jù)文件“DATA6-5.SAV”。
2)啟動線性回歸過程
單擊SPSS主菜單的“Analyze”下的“Regression”中“Linear”項,將打開如圖2-2所示的線性回歸過程窗口。
3) 設(shè)置分析變量
設(shè)置因變量:用鼠標選中左邊變量列表中的“幼蟲密度[y]”變量,然后點擊“Dependent”欄左邊的
向右拉按鈕,該變量就移到“Dependent”因變量顯示欄里。設(shè)置自變量:將左邊變量列表中的“蛾量[x1]”、“卵量[x2]”、“降水量[x3]”、“雨日[x4]”變量,選移到“Independent(S)”自變量顯示欄里。
設(shè)置控制變量: 本例子中不使用控制變量,所以不選擇任何變量。
選擇標簽變量: 選擇“年份”為標簽變量。
選擇加權(quán)變量: 本例子沒有加權(quán)變量,因此不作任何設(shè)置。
4)回歸方式
本例子中的4個預(yù)報因子變量是經(jīng)過相關(guān)系數(shù)法選取出來的,在回歸分析時不做篩選。因此在“Method”框中選中“Enter”選項,建立全回歸模型。
5)設(shè)置輸出統(tǒng)計量
單擊“Statistics”按鈕,將打開如圖2-3所示的對話框。該對話框用于設(shè)置相關(guān)參數(shù)。其中各項的意義分別為:
①“Regression Coefficients”回歸系數(shù)選項:
“Estimates”輸出回歸系數(shù)和相關(guān)統(tǒng)計量。本例子選擇“Estimates”輸出回歸系數(shù)和相關(guān)統(tǒng)計量。
②“Residuals”殘差選項:
“Durbin-Watson”Durbin-Watson檢驗。本例子都不選。
③ 其它輸入選項
“Model fit”輸出相關(guān)系數(shù)、相關(guān)系數(shù)平方、調(diào)整系數(shù)、估計標準誤、ANOVA表。本例子選擇“Model fit”項。
6)繪圖選項
在主對話框單擊“Plots”按鈕,將打開如圖2-4所示的對話框窗口。該對話框用于設(shè)置要繪制的圖形的參數(shù)。圖中的“X”和“Y”框用于選擇X軸和Y軸相應(yīng)的變量。
左上框中各項的意義分別為:
“DEPENDNT”因變量。
“ZPRED”標準化預(yù)測值。
“ZRESID”標準化殘差。
“DRESID”刪除殘差。
“ADJPRED”調(diào)節(jié)預(yù)測值。
“SRESID”學(xué)生氏化殘差。
“SDRESID”學(xué)生氏化刪除殘差。
“Standardized Residual Plots”設(shè)置各變量的標準化殘差圖形輸出。其中共包含兩個選項:
“Histogram”用直方圖顯示標準化殘差。
“Produce all partial plot”偏殘差圖。對每一個自變量生成其殘差對因變量殘差的散點圖。
本例子不作繪圖,不選擇。
7) 保存分析數(shù)據(jù)的選項
在主對話框里單擊“Save”按鈕,將打開如圖2-5所示的對話框。
①“Predicted Values”預(yù)測值欄選項:
Unstandardized 非標準化預(yù)測值。就會在當(dāng)前數(shù)據(jù)文件中新添加一個以字符“PRE_”開頭命名的變量,存放根據(jù)回
本例選中“Unstandardized”非標準化預(yù)測值。
②“Distances”距離欄選項:
Mahalanobis: 距離。
③“Prediction Intervals”預(yù)測區(qū)間選項:
Mean: 區(qū)間的中心位置。
本例不選。
④“Save to New File”保存為新文件:
選中“Coefficient statistics”項將回歸系數(shù)保存到指定的文件中。本例不選。
⑤ “Export model information to XML file” 導(dǎo)出統(tǒng)計過程中的回歸模型信息到指定文件。本例不選。
⑥“Residuals” 保存殘差選項:
“Unstandardized”非標準化殘差。
本例不選。
⑦“Influence Statistics” 統(tǒng)計量的影響。
“DfBeta(s)”刪除一個特定的觀測值所引起的回歸系數(shù)的變化。
本例子不保存任何分析變量,不選擇。
8)其它選項
在主對話框里單擊“Options”按鈕,將打開如圖2-6所示的對話框。
①“Stepping Method Criteria”框用于進行逐步回歸時內(nèi)部數(shù)值的設(shè)定。其中各項為:
“Use probability of F”如果一個變量的F值的概率小于所設(shè)置的進入值(Entry),那么這個變量將被選入回歸方程本例是全回歸不設(shè)置。
②“Include constant in equation”選擇此項表示在回歸方程中有常數(shù)項。
本例選中“Include constant in equation”選項在回歸方程中保留常數(shù)項。
③“Missing Values”框用于設(shè)置對缺失值的處理方法。其中各項為:
“Exclude cases listwise”剔除所有含有缺失值的觀測值。本例選中“Exclude cases listwise”。
9)提交執(zhí)行
在主對話框里單擊“OK”,提交執(zhí)行,結(jié)果將顯示在輸出窗口中。主要結(jié)果見表2-2至表2-4。
10) 結(jié)果分析
主要結(jié)果:
表2-2
表2-2 是回歸模型統(tǒng)計量:R 是相關(guān)系數(shù);R Square 相關(guān)系數(shù)的平方,又稱判定系數(shù),判定線性回歸的擬合程度:用來說明用自變量解釋因變量變異的程度(所占比例);Adjusted R Square 調(diào)整后的判定系數(shù);Std. Error of the Estimate 估計標準誤差。
表2-3
表2-3 回歸模型的方差分析表,F(xiàn)值為10.930,顯著性概率是0.001,表明回歸極顯著。
表2-4
分析:
建立回歸模型:
根據(jù)多元回歸模型:
把表6-9中“非標準化回歸系數(shù)”欄目中的“B”列系數(shù)代入上式得預(yù)報方程:
預(yù)測值
的標準差可用剩余均方估計:回歸方程的顯著性檢驗:
從表6-8方差分析表中得知:F統(tǒng)計量為10.93,系統(tǒng)自動檢驗的顯著性水平為0.001。
F(0.05,4,11)值為3.36,F(0.01,4,11) 值為5.67,F(0.001,4,11) 值為10.35。因此回歸方程相關(guān)非常顯著。(F值可在Excel中用FINV( )函數(shù)獲得)。
回代檢驗
需要作預(yù)報效果的驗證時,在主對話框(圖6-8)里單擊“Save”按鈕,在打開如圖3-6所示對話框里,選中“Predicted Values”預(yù)測值選項欄中的“Unstandardized”非標準化預(yù)測值選項。這樣在過程運算時,就會在當(dāng)前文件中新添加一個“PRE_1”命名的變量,該變量存放根據(jù)回歸模型擬合的預(yù)測值。
然后,在SPSS數(shù)據(jù)窗口計算“y”與“PRE_1”變量的差值(圖2-7),本例子把絕對差值大于0.8視為不符合,反之則符合。結(jié)果符合的年數(shù)為15年,1年不符合,歷史符合率為93.75%。
多元回歸分析法可綜合多個預(yù)報因子的作用,作出預(yù)報,在統(tǒng)計預(yù)報中是一種應(yīng)用較為普遍的方法。
在實際運用中,采取將預(yù)報因子和預(yù)報量按一定標準分為多級,用分級尺度代換較大的數(shù)字,更能揭示預(yù)報因子與預(yù)報量的關(guān)系,預(yù)報效果比采用數(shù)量值統(tǒng)計方法有明顯的提高,在實際應(yīng)用中具有一定的現(xiàn)實意義。
聯(lián)系客服