聚类分析在经济学当中的一个应用
[摘要] 本文根据系统聚类分析的最小离差平方和法,利用SPSS软件,通过浙江省11个地市的国民主要指标,对处在不同经济水平的各个地市进行聚类分析,从而将浙江省划分为三个经济发展水平不同的经济区域,结果供有关决策部门。
[关键词] 最小离差平方和法 主要经济指标 聚类分析
聚类分析又称群分析,是多元统计分析中研究样本或指标的一种主要的分类方法,起源于考古分类学。随着经济和社会的发展,结合了更为强大的数学工具的聚类分析方法已经越来越多应用到经济分析和社会工作分析中。在经济领域中,主要是根据影响国家、地区乃至单个的经济效益、发展水平的各项指标进行聚类分析,然后根据分析结果进行综合评价,以便得出的结论。聚类分析的方法主要有两种,一种是“快速聚类分析方法”(K-Means Cluster Analysis),另一种是“系统聚类分析方法”(Hierarchical Cluster Analysis)。本文将根据2004年浙江省各市国民经济主要指标,利用系统聚类的Ward’s Method,对浙江省11个市进行分类。
一、聚类方法简介
系统聚类法(hierarchical clustering method)是使用最多的一种聚类方法。它的基本思想是:
1.将全部n个样品各看成一类,即得到n类;
2.确定样品与样品和类与类之间的距离;
3.各类之间的距离,并将距离最近的两类合并为一类,形成一个新的类;
4.重复步骤3。这样从有n类开始,每次合并一类,经过n-1次合并后,所有的样品成为一类;
5.将上述合并的全部聚类过程用一个直观图形画出来,即画出聚类图;
6.决定类的个数,并由上述步骤得到相应的聚类分析的结果。
以下我们用Gij表示第i个样品与第j个样品的距离,G1,G2,…表示类,GKL表示GK与GL的距离。本节介绍的系数聚类法中,类与类之间的距离与样品之间的距离相同,即DKL=dkl。
二、 数据处理
:国内生产总值 GDP(亿元);:社会固定资产投资(亿元);
:全社会消费品零售总额(亿元);:城镇居民人均可支配收入(元);
:居民人均纯收入(元)。
1.原始数据标准化
2.SPSS软件处理结果
我们采用系统聚类分析法的Ward’s Method对标准化后的数据进行处理,下面对软件输出结果进行详细介绍。
使用SPSS的Classify→Hierarchical Cluster程序进行聚类分析。其中Method子对话框里,方法选择最小方差法(Ward’s Method),间距测度变量选择Squared Euclidean distance(欧氏距离的平方),然后得出如下结果:
(1)系统聚类分析的概要结果,
该表格是样本系统聚类分析聚成3个类时,样本的类归属情况表。从该表格可以看出,杭州市,宁波市2个市聚为一类;温州市,嘉兴市,绍兴市,台州市4个市聚为一类;湖州市,金华市,舟山市, 衢州市,丽水市5个市聚为一类。
(4)聚类图
这个图是系统聚类分析的谱系图(Dendrogram)。从图中可以看出,各个类之间的距离在25的坐标内。借此可以直观地显示整个聚类的过程。
3.通过以上的分类表和龙骨图(谱系图)可以清楚的看到,离差法聚类分析结果
(1)较发达城市:杭州市,宁波市;
(2)中等发达城市:温州市,嘉兴市,台州市,绍兴市;
(3)中城市:金华市,湖州市,舟山市,衢州市,丽水市。
三、 结果分析
通过上面的聚类分析,根据2004年浙江省各市国民的主要指标,我们将目前浙江省各市县的经济发展水平划分为3个经济区域:
1.较发达城市:杭州市,宁波市
2.中等发达城市:温州市,嘉兴市,台州市,绍兴市,金华市,湖州市,舟山市
3.发展中城市:衢州市,丽水市
从聚类结果我们可以发现,发达城市杭州市和宁波市,由于城市发展悠久,基础建设比较完善,产业机构比较合理,城市规模较大,城市经济发展快,所以把它们归类为经济发达的城市。而中等发达城市,湖州市、嘉兴市和舟山市由于靠近上海,与上海的社会经济关系比较密切,依托上海,大力发展外贸经济。其他4个城市一般为沿海城市,对外贸易便利,而且这里有浙东两条黄金线(杭州—绍兴—宁波—舟山;杭州—绍兴—台州),旅游业也很发达,因此经济达到中等发达水平,而金华市跟多个市比邻,所以跟其他市的经济贸易也比较频繁,经济方面相对来说也是比较发达的。而衢州市,丽水市由于位于地理位置原因,基础建设相对滞后,产业结构不够合理,财政收入少,所以经济会相对比较落后。
当然,以上分析结果仅是根据一年的经济主要指标得出的结论,如果要想进行更准确合理的分析,还需要进一步结合其它的数据进行分析。
:
[1]张尧庭方开泰:多元统计分析引论[M].北京:出版社,1982
[2]王学仁王松桂:实用多元统计分析[M].上海:上海科学技术出版社,1990
[3]钱俊龙:概率论与应用统计[M].北京:统计出版社,1992
[4]何晓群:统计分析方法与应用[M].北京:中国人民大学出版社,1998
[5]于秀林任雪松:多元统计分析[M].北京:中国统计出版社,1999
[6]李双杰顾六宝:用聚类分析法评估区域经济[J].中国观察,2001
[7]苏金明:统计软件SPSS系列应用实战篇[M].北京:出版社,2002
[8]郝黎仁:SPSS实用统计分析[M].北京:中国水利水电出版社,2002
[9]吴明隆:SPSS统计应用实务[M].科学出版社,2003
[10]卢纹岱:SPSS for Windows统计分析[M].北京:电子工业出版社,2004
[11]何晓群:多元统计分析[M].北京:中国人民大学出版社,2004
[12]王学明:应用多元分析[M].上海: 上海财经大学出版社,2004
[13]浙江省统计局,2005浙江统计年鉴.中国统计出版社,2005