统计年鉴与基尼系数
基尼系数有很多种算法,包括万分法、人口等分法、三角形面积法、弓形面积法、积分法、基尼平均法、城乡加权法等等,但很多算法都不适合利用统计年鉴来,有些算法虽然是根据统计年鉴来计算,但由于该算法所依据的数据,统计年鉴并没有进行性的公布,导致很难得到统一、连贯的基尼系数。
例如,按照三角形面积法计算,虽然比较简便,而且也比较精确,但这种算法仅能计算2002年以后的基尼系数,2001年及以前的数据没有公布,因此也无法计算。
在这些算法中,综合来看,五分法比较理想,虽然有一定的误差,但可以计算出统一、连贯的基尼系数,值得。
一、公式推导
这种算法根据的是基尼系数与洛伦茨曲线的相关性,利用收入分组五分法数据,得出基尼系数的计算公式 ,即
该公式即收入五分法下的基尼系数计算公式。
所谓的五分法,即将收入组分为最低收入组、较低收入组、中等收入组、较高收入组和最高收入组,利用各收入组的收入占总收入的比重,来计算基尼系数。现假定五大组占总收入的5个比重 呈近似等差数列(记公差为D),有:
上式中s是比较小的数(small),B是比较大的数(big),m是比s略大的介于s与B中间的数(middle)。根据收入五分法公式可得:
由于公差D的设定,使得B与2m相差并不大,再被分母5除后相差更小,所以可以被谨慎的忽略,则有。其意义是:基尼系数近似等于五分法收入最高的那组人的收入百分比与收入最低的那组人的收入百分比之差。
二、计算基尼系数
从我国统计年鉴公布的数据看,、城镇是分别统计的,而且各自的分组不一致,因此需要对分组数据进行加工。根据历年统计年鉴,将农村最低收入组的人均年纯收入与城镇困难户(城镇最低收入组的5%)的人均年可支配收入相比较,可以发现,中国最低收入的20%的人群在农村;同理可以发现,中国最高收入的20%的人群在城镇。结合统计年鉴公布的数据,我们可通过计算目标累积比重,来确定相对应的收入分组值。
通过查阅累积比重对应的收入分组值,可以计算该收入分组值中的人均年纯收入M(或城镇相关组的人均年可支配收入N);另外,全国城乡居民的人均年收入Q可以通过统计年鉴计算得出[1],则有:
下面以2005年为例加以说明。
根据统计年鉴,可查得2005年的城镇人口为56212万人,农村人口为74544万人,全国总人口为130756万人,则城镇人口占总人口比重为42.99%,农村人口为57.01%,城镇的目标累积比重为46.52%(20%÷42.99%),农村的为35.08%(20%÷57.01%)。
通过农村的目标累积比重为35.08%,可以查得该目标累积比重对应的收入情况,如表1。
表1 2005年中国最贫穷家庭的收入分布情况
人均年收入分组 | 在农村总收入中的比重 | 累积比重 |
100元以下 | 0.65 | 0.65 |
100-200元 | 0.11 | 0.76 |
200-300 | 0.2 | 0.96 |
300-400 | 0.31 | 1.27 |
400-500 | 0.41 | 1.68 |
500-600 | 0.57 | 2.25 |
600-800 | 1.88 | 4.13 |
800-1000 | 2.84 | 6.97 |
1000-1200 | 3.53 | 10.50 |
1200-1300 | 1.97 | 12.47 |
1300-1500 | 4.4 | 16.87 |
1500-1700 | 4.89 | 21.76 |
1700-2000 | 7.67 | 29.43 |
2000-2250 | 6.25 | 35.68 |
(注:最后一行的35.68是通过平均插值法得出的近似值)
由上表可知, 2005年全国“最低收入组”分布于0-2250元这一收入分组中,通过取中值的方法,可以该组的人均年纯收入M=1489.88元。
同理,通过城镇的人均年可支配收入分组情况,可计算出全国“最高收入组”的人均年可支配收入N=17814.72元。
另外,通过统计年鉴数据可以算出全国城乡居民的人均年收入Q=6366.58。
则G ==51.28。
需要说明的是,这种计算方法虽然比较简单,但由于将不同收入分组假定为近似等差数列,因此,算出的结果是有误差的,从理论上讲,这种方法计算的基尼系数,比实际的基尼系数要略高。表2是根据五分法计算的历年基尼系数。
表2 用简易公式计算出的历年基尼系数
年份 | 最低收入的20% | 最高收入的20% | 基尼系数(%) |
2007 | 4.41 | 51.29 | 46.88 |
2006 | 4.54 | 56.13 | 51.59 |
2005 | 4.68 | 55.96 | 51.28 |
2004 | 4.69 | 54.77 | 50.08 |
2003 | 5.62 | 53.28 | 47.66 |
2002 | 4.88 | 51.58 | 46.70 |
2001 | 5.12 | 48.07 | 42.95 |
2000 | 5.43 | 45.56 | 40.13 |
1999 | 5.98 | 44.18 | 38.21 |
1998 | 6.12 | 42.96 | 36.84 |
资料:
1. 王祖祥,《分组数据条件下基尼系数的有效估算方法》,载《数量技术经济研究》,2001年第8期。
2.雍红月等,《基尼系数的计算方法与实证分析》,载《内蒙古大学学报》,2007年第2期。
3.习 明等,《基尼系数的一种简便计算方法》,载《统计与决策》,2007年第21期。
4.胡祖光,《基尼系数理论最佳值及其简易计算公式研究》,载《经济学研究》,2004年第9期。
5.胡祖光,《基尼系数和统计数据——以浙江省为例》,载《浙江社会》,2005年第4期。
6.钱敏泽,《中国现行统计方法基尼系数的推算及结果》,载《经济理论与经济管理》,2002年第11期。
7. 张建华,《一种简便易用的基尼系数计算方法》,载《山西农业大学学报》(社会科学版),2007年第6卷(第3期)。
[1]Q=城镇居民人均收入×城镇人数+居民人均收入×人数)÷总人数