正文 長三角城市居民收入與消費支出地區差異實證研究(1 / 2)

長三角城市居民收入與消費支出地區差異實證研究

區域經濟

作者:毛健

摘要:文章運用因子分析和K-Means聚類分析等定量分析手段,對2013年長三角16個城市居民家庭人均可支配收入和消費支出的數據進行了研究。通過聚類分析將上述城市分為三類,並反映出各城市間的差距。

關鍵詞:長三角;城市居民;收入消費;實證研究

中圖分類號:F126.2 文獻標識碼:A 文章編號:1001-828X(2014)03-0-02

長江三角洲地區是我國經濟、科技、文化最發達的地區之一,其經濟發展一直位居全國前列,城市居民家庭收入和消費水平較高,所有地區均已經進入全麵小康階段。與收入相比,消費總量及其結構可以更直接地反映居民的生活現狀。由於長三角地區各城市之間經濟發展不平衡、自然條件以及消費觀念等因素的影響,城市居民家庭消費支出及其結構存在較大差異。為客觀、合理、準確地分析長三角地區城市居民人均可支配收入、消費支出及其結構的差異性和相似性,本文運用因子分析和K-Means聚類分析等定量分析手段,係統研究了長三角地區城市居民的收入與消費問題。

一、因子選取和研究方法

(一)選取適合因子分析的原始變量

為研究長三角地區城市居民家庭人均可支配收入和生活消費支出的差異性和相似性,選取2013年長三角地區16個城市居民家庭人均可支配收入和消費支出結構10個指標(城市居民人均可支配收入Y、城市居民人均消費支出X、食品X1、衣著X2、居住X3、家庭設備用品及服務X4、醫療保健X5、交通通訊X6、娛樂文教服務X7、其他商品和服務X8)進行因子分析和K-Means聚類分析。

首先考察這10個指標的原始數據內變量之間的線性關係,確定其是否適合采用因子分析提取因子。9個變量之間相關係數值都較高(>0.4),呈較強的線性關係,能夠從中提取公共因子,可以選取這9個原有變量適合進行因子分析。再用這9個原有變量進行Bartlett球度檢驗,得出的觀測值為107.975,相應的概率P接近0,說明相關係數矩陣與單位陣有顯著差異,同時KMO值為0.551,根據KMO度量標準可知,原有這9個變量適合進行因子分析。

(二)研究方法

1.因子分析

因子分析的基本目的就是用少數幾個因子去描述許多指標或因素之間的聯係,以反映原有變量的大部分信息。它是從研究變量內部相關的依賴關係出發,把一些具有複雜關係的變量歸結為少數幾個綜合因子的一種多變量統計分析方法。它是將觀測變量進行分類,將相關性較高,即聯係比較緊密的分在同一類中,而不同類變量之間的相關性則較低,那麼每一類變量實際上就代表了一個基本結構,即公共因子。對於所研究的問題就是試圖用最少個數的不可測的所謂公共因子的線性函數與特殊因子之和來描述原來觀測的每一分量。運用這種研究技術,可以方便地找出影響城市居民收入、消費及其結構的主要因素是哪些,以及它們的影響力(權重)。

2.K-Means聚類分析

K-Means聚類也稱快速聚類,是將數據看成K維空間上的點,以距離作為測度個體/親疏程度0的指標,並通過犧牲多個解為代價換得高的執行效率。其一般步驟為:

指定聚類數目K。在K-Means聚類中,首先要求用戶自行給出需要聚成多少類,最終也隻能輸出關於它的唯一解。

確定K個初始類中心。在SPSS中初始類中心點的指定方式有2種:一是用戶指定方式;二是SPSS係統根據樣本數據的具體情況選擇K個有一定代表性的樣本作為初始類中心點。

根據距離最近原則進行分類。依次計算每個樣本數據點到K個類中心點的歐氏距離,並按照距K個類中心點距離最短的原則將所有樣本分派,形成K個分類。

重新確定K個類中心,中心點的確定原則是,依次計算各類中K個變量的均值,並以均值點作為K個類的中心點。判斷是否已滿足終止聚類分析的條件。

可見,K-Means快速聚類是一個反複迭代的分類過程,在聚類過程中,樣本所屬的類會不斷調整,直到最終達到穩定為止。

二、結果與分析

城市居民收入與消費支出指標的因子提取。根據選取的適合進行因子分析的7個變量,采用主成分分析法提取因子並選取特征根值大於1的特征根。在因子分析初始解下的變量共同度中,原有變量的所有方差都可被解釋,變量的共同度均為1;在按指定提取條件提取特征根時的共同度中,其中8個變量的絕大部分信息(>74%)可被因子解釋,另一個變量損失55%,總體信息丟失較少,此次因子提取的總體效果較為理想。