主成分分析在SPSS中的操作應(yīng)用
(作者未知) 2009/4/3
(接上頁)215.8 384.7 643.7
上海 5408.8 40627 86.2 2196.2 2755.8 1970.2 779.3 2035.2 320.5 709
浙江 7670 16570 680 2356.5 3065 2296.6 1180.6 2877.5 294.2 566.9
福建 4682 13510 663 1047.1 1859 964.5 397.9 1663.3 173.7 272.9
廣東 11770 15030 1023.9 4224.6 4793.6 3022.9 1275.5 5013.6 1843.7 1202
廣西 2437.2 5062 591.4 367 995.7 542.2 352.7 1025.5 15.1 186.7
(二)主成分分析在SPSS中的具體操作步驟
運(yùn)用SPSS統(tǒng)計分析軟件Factor過程[2]對沿海10個省市經(jīng)濟(jì)綜合指標(biāo)進(jìn)行主成分分析。具體操作步驟如下:
1. AnalyzeàData ReductionàFactor Analysis,彈出Factor Analysis對話框
2. 把X1~X10選入Variables框
3. Descriptives: Correlation Matrix框組中選中Coefficients,然后點(diǎn)擊Continue,返回Factor Analysis對話框
4. 點(diǎn)擊“OK”
圖表 2 Factor Analyze對話框與Descriptives子對話框
SPSS在調(diào)用Factor Analyze過程進(jìn)行分析時,SPSS會自動對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,所以在得到計算結(jié)果后指的變量都是指經(jīng)過標(biāo)準(zhǔn)化處理后的變量,但SPSS不會直接給出標(biāo)準(zhǔn)化后的數(shù)據(jù),如需要得到標(biāo)準(zhǔn)化數(shù)據(jù),則需調(diào)用Descriptives過程進(jìn)行計算。
圖表 3 相關(guān)系數(shù)矩陣
圖表 4 方差分解主成分提取分析表
主成分分析在SPSS中的操作應(yīng)用(下)
圖表 5 初始因子載荷矩陣
從圖表3可知GDP與工業(yè)增加值,第三產(chǎn)業(yè)增加值、固定資產(chǎn)投資、基本建設(shè)投資、社會消費(fèi)品零售總額、地方財政收入這幾個指標(biāo)存在著極其顯著的關(guān)系,與海關(guān)出口總額存在著顯著關(guān)系?梢娫S多變量之間直接的相關(guān)性比較強(qiáng),證明他們存在信息上的重疊。
主成分個數(shù)提取原則為主成分對應(yīng)的特征值大于1的前m個主成分。注:特征值在某種程度上可以被看成是表示主成分影響力度大小的指標(biāo),如果特征值小于1,說明該主成分的解釋力度還不如直接引入一個原變量的平均解釋力度大,因此一般可以用特征值大于1作為納入標(biāo)準(zhǔn)。通過圖表4(方差分解主成分提取分析)可知,提取2個主成分,即m=2,從圖表5(初始因子載荷矩陣)可知GDP、工業(yè)增加值、第三產(chǎn)業(yè)增加值、固定資產(chǎn)投資、基本建設(shè)投資、社會消費(fèi)品零售總額、海關(guān)出口總額、地方財政收入在第一主成分上有較高載荷,說明第一主成分基本反映了這些指標(biāo)的信息;人均GDP和農(nóng)業(yè)增加值指標(biāo)在第二主成分上有較高載荷,說明第二主成分基本反映了人均GDP和農(nóng)業(yè)增加值兩個指標(biāo)的信息。所以提取兩個主成分是可以基本反映全部指標(biāo)的信息,所以決定用兩個新變量來代替原來的十個變量。但這兩個新變量的表達(dá)還不能從輸出窗口中直接得到,因?yàn)椤癈omponent Matrix”是指初始因子載荷矩陣,每一個載荷量表示主成分與對應(yīng)變量的相關(guān)系數(shù)。
用圖表5(主成分載荷矩陣)中的數(shù)據(jù)除以主成分相對應(yīng)的特征值開平方根便得到兩個主成分中每個指標(biāo)所對應(yīng)的系數(shù)[2]。將初始因子載荷矩陣中的兩列數(shù)據(jù)輸入(可用復(fù)制粘貼的方法)到數(shù)據(jù)編輯窗口(為變量B1、B2),然后利用“TransformàCompute Variable”,在Compute Variable對話框中輸入“A1=B1/SQR(7.22)” [注:第二主成分SQR后的括號中填1.235],即可得到特征向量A1(見圖表6)。同理,可得到特征向量A2。將得到的特征向量與標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,然后就可以得出主成分表達(dá)式[注:因本例只是為了說明如何在SPSS進(jìn)行主成分分析,故在此不對提取的主成分進(jìn)行命名,有興趣的讀者可自行命名]:
F1=0.353ZX1+0.042ZX2-0.041ZX3+0.364ZX4+0.367ZX5+0.366ZX6+0.352ZX7+0.364ZX8+0.298ZX9+0.355ZX10
F2=0.175ZX1-0.741ZX2+0.609ZX3-0.004Z(未完,下一頁)
|