全國信息化水平聚類分析研究
(作者未知) 2010/6/4
【摘要】本文認真參考了信息化水平指標,總結(jié)出信息化水平指標評價體系,同時采用因子分析法對全國各省份的信息化水平進行排序,并在此基礎(chǔ)上進行聚類分析,最后按不同類型對各省份進行簡單分析,進一步提出讓信息化水平提高的對策。
【關(guān)鍵詞】信息化 指標體系 因子分析 聚類分析
一、引言
隨著信息技術(shù)的持續(xù)創(chuàng)新,發(fā)達國家向信息社會轉(zhuǎn)移的趨勢越來越明顯,步伐越來越快。加快發(fā)展本國以及城市的信息化水平是個必然的趨勢。推進信息化是轉(zhuǎn)變經(jīng)濟增長方式的根木途徑,有利于促進人與自然的協(xié)調(diào)發(fā)展;有利于促進城鄉(xiāng)經(jīng)濟社會統(tǒng)籌、協(xié)調(diào)發(fā)展;有利于提高社會管理水平,增強公共服務(wù)能力,保持杜會安定有序;有利于發(fā)展壯大先進文化,為和諧社會營造良好的文化氛圍。在推進信息化的同時,為了更好地把握我國信息化普及與應(yīng)用的狀況和程度,評價與監(jiān)測我國信息化的成果、發(fā)展水平與存在的問題。為國家信息化發(fā)展規(guī)劃提供必要的數(shù)據(jù)支也必然需要進行信息化水平測試,這就會引發(fā)一系列的問題,從而引進因子分析和聚類分析來使此過程變的簡單或者說更為有序化。
二、變量指標的選取
國家統(tǒng)計局在其《中國信息能力報告》中,設(shè)計了一套評價我國信息化水平的指標:指標體系共分4級,有25個指標:①信息技術(shù)和信息設(shè)備應(yīng)用能力:a.每千人擁有PC數(shù);b.每千人擁有傳真機數(shù);c.每百人擁有電話數(shù);d.每千人擁有電視機數(shù);e.每千人擁有收音機數(shù);f.每萬人接入因特網(wǎng)用戶;g.每百萬人互聯(lián)網(wǎng)上網(wǎng)主機數(shù);h.每平方公里光纜長度;i.每百家企事業(yè)單位上網(wǎng)數(shù);j.基礎(chǔ)信息產(chǎn)業(yè)產(chǎn)值占GDP比重。②信息資源及開發(fā)利用能力:a.每戶打國際電話時間;b.每百人期刊發(fā)行量;c.每日發(fā)布信息量;d.網(wǎng)絡(luò)用戶平均上網(wǎng)時間;e.每萬人Web站點數(shù)。③人口素質(zhì):a.每萬人平均科學家和工程師數(shù);b.第三產(chǎn)業(yè)從業(yè)人數(shù)占就業(yè)總?cè)丝诒戎兀籧.大學入學率;d.每十萬人在校學生數(shù);e.計算機專家和工程師數(shù)。④國家對信息產(chǎn)業(yè)發(fā)展的支撐:a.信息產(chǎn)業(yè)產(chǎn)值占GDP比重;b.研究開發(fā)(R&G)支出占GDP比重;c.每主線電信投資;d.人均GNP;e.教育投入。
鑒于遵循數(shù)據(jù)的客觀性和代表性,以及易得性,本文采取以下指標:每千人工業(yè)增加值 x1;每千人電信業(yè)務(wù)量x2;每千人移動通信交換機容量x3; 移動電話普及率x4;電話普及率x5;廣播綜合人口覆蓋率x6; 電視綜合人口覆蓋率x7; 有線電視普及率x8;每十戶寬帶上網(wǎng)用占有戶數(shù)x9; R&D經(jīng)費支出占GDP比重x10;每十人從事科技活動人員總數(shù)占有的人數(shù)x11;每十人在校大學生人數(shù)占有的人數(shù)x12;每千人專利授權(quán)數(shù)占有數(shù)x13。其中缺省值用平均值代替或者臨近年數(shù)內(nèi)值代替。由于篇幅有限,指標數(shù)據(jù)省略。
三、因子分析
因子分析法是能夠?qū)崿F(xiàn)數(shù)據(jù)簡化目的的有效方法之一。其基本思想是根據(jù)相關(guān)性大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,使不同組的變量相關(guān)性較低,每組變量代表一個基本結(jié)構(gòu),這個基本結(jié)構(gòu)稱為公共因子。運用因子分析法,借助EXCEL多元統(tǒng)分析,對已得的指標數(shù)據(jù)進行分析處理,在處理過程中選取方差貢獻比率為0.80。
按照方差貢獻比率大于80%,應(yīng)提取前四個因子,它們所解釋的方差占總方差的84.58%,這四個因子就可以解釋原始數(shù)據(jù)的大部分信息了。
分析結(jié)果中可以得到每個城市的四個因子得分情況F1,F(xiàn)2,F(xiàn)3和F4。最后,對28個城市的信息化水平進行綜合評價并排序。以旋轉(zhuǎn)后四個因子的方差貢獻率為權(quán)數(shù)計算綜合得分,計算公式為:F=0.5923F1+0.09957F2+0.0804F3+0.0736F4,最終可以得到所有城市的綜合得分排名。
由于變量指標取值的同向性,得分越高代表信息化水平越高。排名依次為:北京,天津、廣東、浙江、江蘇、湖南、福建等等。
四、聚類分析
聚類分析是統(tǒng)計學中研究“物以類聚”問題的多元統(tǒng)計分析方法,在統(tǒng)計分析的應(yīng)用領(lǐng)域已經(jīng)得到了極為廣泛的應(yīng)用。其思路為:首先每個數(shù)據(jù)對象自成一類,并且計算各個類之間的“距離”或者相似性。然后每次將最相似的兩類合并,合并后重新計算新類與其他各個類之間的距離或相似度。這一“凝聚”的過程一直繼續(xù)直到所有對象都歸為一類為止。 利用各城市的因子得分,還可對28個城市進行分類,得分值相近的城市被認為具有較相似的屬性。
五、結(jié)果分析
由所得到的聚類圖可以看出,全國信息化水平基本上可以分為五類,北京,山西各成一類,從上面的綜合水平排名可以看出,北京信息化水平處于全國領(lǐng)先地位,這首先歸功于北京的地理位置和政治人文環(huán)境,其次結(jié)合因子得分矩陣,北京(未完,下一頁)
|
|
相關(guān)專業(yè)論文
|
|
推薦專業(yè)論文
|
|
|
|