对能源消耗总量影响因素的实证分析
关键词:模型 时间序列平稳性 多重共线性 异方差 自回归 检验 修正
一、引言
随着能源危机的出现,能源消耗问题成为了一个世界性的热点问题。本文主要分析影响能源消耗量的变量与能源消耗之间的相关关系。
二、对能源消耗现状的分析
(一)能源消耗总量的研究分析
经调查研究,能源主要包括原煤原油、天然气、水电、核电、风电等。近年来我国经济快速,国内生产总值GDP稳定增长,人民生活水平显著提高。但我们也应该看到,随着经济的增长,能源消耗的总量也越来越多,越来越快。石油危机、淡水资源匮乏、臭氧层空洞、植被减少、稀有物种灭绝等现象频频出现。有的国家甚至连续多年都出现了能源危机。
(二)能源消耗总量增加的原因
1.经济增长
首先,随着人们生活水平的普遍提高,拥有电冰箱、空调、暖气、电脑、电视机、私家车等家庭生活用品的家庭数量增长了很多,这就造成了能源消耗数量普遍性的提高;其次,随着经济的快速发展,国内新建了许多,这些企业每天都在消耗大量能源。国内生产总值GDP是衡量经济发展状况的重要因素,GDP的增长包括农业,工业,建筑业等多方面的增长。其中,工业,建筑业,运输业的发展都需要消耗大量的能源。再次,经济增长促进了科技的发展,而科技水平的提高促使了能源消耗水平的提高。能源消耗不会像过去一样仅仅局限在日常照明和少有的工业企业上了。这样便形成了一个恶性循环,经济越发展,科技越发达,能源消耗的越多。综上,经济的发展是能源消耗总量增加的最根本原因。
2.能源生产总量的增加
能源生产总量的增加是导致能源消耗总量增加的直接原因。经济的增长导致能源需求量的增加,有需求必然会有供应,这就必然导致了能源生产量的增加。
3.人口增加
随着中国人口数量的增长,家庭耗电量,家庭用水量等各方面消耗都在增加。而且,每个人都是一个无底洞,从出生到死亡,每个人都会消耗数不尽的能源。我们每个人的日常生活,衣、食、住、行、娱乐等各方面都会消耗能源。我们不应该忘记,再微小的白色塑料袋,也是用我们的资源制造的,而且这些资源都是不可再生的。
4.生活文化的改变
随着生活节奏的加快,人们更倾向于快节奏,高效率的生活方式,这就滋生了许多人使用一次性筷子,一次性茶杯等用具的心理。而且高效率,快节奏的生活方式导致了人们铺张浪费的生活习惯。
三、研究目的
为了使国内的能源能持续被利用,坚持可持续发展道路,需要定量地分析影响能源消耗总量的主要因素。并且从这些方面入手尽量减少能源的消耗。
四、实证分析
(一)理论依据
1.总论
从上文所提到的内容中,我们可以得出结论,影响能源消耗总量的主要因素,除了能源生产总量外,还可能与经济发展的快慢、人口数量、生活习惯、人们的生活水平息息相关。因此这里考虑到的影响能源消耗总量的因素主要有:能源生产总量X1,,城镇人口X2,国内生产总值GDP(1978年不变价)X3, 工业GDP X4(1978年不变价),人均GDP X5(1978年不变价),乡村人口X6。其中GDP作为经济发展的快慢的代表,城镇人口和乡村人口作为人口数量的代表,人均GDP作为人们生活水平的代表,工业GDP作为工业发展水平的代表。因为上文提到的生活文化的改变无法找到具体的数据进行度量,所以,此因素只能归入到人均GDP中。为此设定以下形式的计量经济模型:
其中 , 为第i年能源消耗总量
X1为能源生产总量 (万吨标准煤)
X2 城镇人口 (万人)
X3 GDP(1978年可比价) (百亿元)
X4 工业GDP(1978年可比价) (百亿元)
X5 人均GDP(1978年可比价) (百亿元)
X6 乡村人口 (万人)
2.时间序列平稳性检验与修正
因为所用的数据为时间序列数据,而大多数经济时间序列是非平稳的,如果直接将非平稳的时间序列当作平稳时间序列来进行分析,则可能造成“伪回归”。所以首先要对时间序列的平稳性进行检验。
3.多重共线性检验与修正
由于有6个解释变量,各解释变量的观测值之间可能存在线形相关关系,所以需要对模型进行多重共线性的检验。
4.自相关的检验与修正
所用数据为时间序列数据。由于经济系统的经济行为都具有时间上的惯性,所以大多数时间序列数据中都有自相关现象。此外,经济活动的滞后效应、模型设定错误、数据的处理等多种原因都可能导致出现自相关。因此,需要对模型进行自相关的检验并进行修正。
5.异方差的检验与修正
能源消耗总量的多元分析模型,是一个复杂的经济模型,因此,有可能此模型中略去的变量随解释变量的变化而呈性的变化,即模型中存在异方差现象。也有其他可能原因导致此模型存在异方差现象,如:变量的设定问题、利用平均数作为样本数据等。综上,需要对此模型进行异方差检验并修正。
(二)数据来源
从中国统计年鉴2007中整合了能源消耗总量及构成,能源生产总量及构成,国内生产总值,人口数及构成这四个国民经济统计数据后得到如下数据:
年份 | 能源消耗总量 | 能源生产总量 | 城镇人口 | 乡村人口 | GDP可比价 | 工业GDP可比价 | 人均GDP可比价 |
1978 | 57144 | 62770 | 17245 | 79014 | 36.45 | 16.07 | 3.81 |
1979 | 58588 | 64562 | 18495 | 79047 | 37.76 | 16.28 | 3.95 |
1980 | 60275 | 63735 | 19140 | 79565 | 39.19 | 16.31 | 4.10 |
1981 | 59447 | 63227 | 20171 | 79901 | 40.07 | 16.45 | 4.19 |
1982 | 62067 | 66778 | 21480 | 80174 | 39.99 | 16.42 | 4.18 |
1983 | 66040 | 71270 | 22274 | 80734 | 40.40 | 16.44 | 4.23 |
1984 | 70904 | 77855 | 24017 | 80340 | 42.40 | 16.80 | 4.43 |
1985 | 76682 | 85546 | 25094 | 80757 | 46.74 | 17.58 | 4.89 |
1986 | 80850 | 88124 | 26366 | 81141 | 48.93 | 18.43 | 5.12 |
1987 | 86632 | 91266 | 27674 | 81626 | 51.47 | 18.83 | 5.38 |
1988 | 92997 | 95801 | 28661 | 82365 | 57.70 | 20.57 | 6.03 |
1989 | 96934 | 101639 | 29540 | 83164 | 62.63 | 21.98 | 6.55 |
1990 | 98703 | 103922 | 30195 | 84138 | 66.27 | 22.49 | 6.93 |
1991 | 103783 | 104844 | 31203 | 84620 | 70.81 | 23.19 | 7.41 |
1992 | 109170 | 107256 | 32175 | 84996 | 76.62 | 24.34 | 8.01 |
1993 | 115993 | 111059 | 33173 | 85344 | 88.25 | 27.96 | 9.23 |
1994 | 122737 | 118729 | 34169 | 85681 | 106.44 | 32.28 | 11.13 |
1995 | 131176 | 129034 | 35174 | 85947 | 121.03 | 36.25 | 12.66 |
1996 | 138948 | 132616 | 37304 | 85085 | 128.80 | 38.03 | 13.47 |
1997 | 138173 | 132410 | 39449 | 84177 | 130.77 | 38.20 | 13.68 |
1998 | 132214 | 124250 | 41608 | 83153 | 129.61 | 36.24 | 13.55 |
1999 | 130119 | 125935 | 43748 | 82038 | 127.95 | 35.21 | 13.38 |
2000 | 138553 | 128978 | 45906 | 80837 | 130.56 | 35.80 | 13.65 |
2001 | 143199 | 137445 | 48064 | 79563 | 133.24 | 35.86 | 13.94 |
2002 | 151797 | 143810 | 50212 | 78241 | 134.03 | 35.49 | 14.02 |
2003 | 174990 | 163842 | 52376 | 76851 | 137.50 | 36.47 | 14.38 |
2004 | 203227 | 187341 | 54283 | 75705 | 147.03 | 38.81 | 15.38 |
2005 | 224682 | 205876 | 56212 | 74544 | 152.85 | 41.20 | 16.05 |
2006 | 246270 | 221056 | 57706 | 73742 | 158.86 | 43.15 | 16.53 |
其中,GDP, 工业GDP, 人均GDP这三组数据采用的是1978年的可比价,这样就可以消除价格指数的影响。
(三)数据分析
1.模型的设定
经过上文分析,模型最终设定为:
2.时间序列平稳性的检验与修正
用图形法判断时间序列是否是平稳的。具体做法是:分别做出解释变量、被解释变量与时间的散点图(横轴为时间,纵轴为变量),从图形的分布形式判断时间序列是否是平稳的。图行如下:
形如下
从这几个图形中我们可以看出:除乡村人口外,其它解释变量的图形分布大致随时间的增长而呈上升趋势,所以时间序列是非平稳的。
因为乡村人口的存在会使模型存在“伪回归”现象,而人口数量可以用城镇人口来表示,所以经分析,剔除乡村人口这一因素。
3.多重共线性的检验与修正
这里用简单相关系数法对解释变量之间是否存在多重共线性进行检验。用Excel软件,对数据进行简单相关系数分析,得到相关系数表,具体数据如下:
| 能源生产总量 | 城镇人口 | GDP可比价 | GDP可比价 | 人均GDP可比价 |
能源生产总量 | 1 |
|
|
|
|
城镇人口 | 0.959489 | 1 |
|
|
|
GDP可比价 | 0.919296 | 0.954812 | 1 |
|
|
工业GDP可比价 | 0.909564 | 0.929421 | 0.995594 | 1 |
|
人均GDP可比价 | 0.919021 | 0.954758 | 0.99999 | 0.99554 | 1 |
由以上数据,我们可以看出:数据存在严重多重共线性问题。需要对此模型进行修正。
用逐步回归法对多重共线性进行修正。由SPSS软件得到如下数据:
从以上数据可知,经过逐步回归之后,只有能源生产总量这一个解释变量进入了模型,而且其VIF值为1.000符合标准。(VIF的大小反映了解释变量之间是否存在多重共线性,经验表明,VIF≥10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种共线性可能会过度的影响最小二乘估计。)但由于实际经验及研究表明,能源消耗总量与GDP也有高度相关关系,所以需要把不变价GDP也加入到模型中。所以最后得到的模型如下:
其中, 的系数由OLS估计得到。
4.自相关的检验与修正
采用DW检验法检验模型是否存在自相关。用SPSS软件得到如下数据:
由以上图表可知,DW值为1.026。取显著性水平 =0.05。查DW分布表得,在显著性水平为0.05,样本容量n=29,解释变量个数 =2 时,临界值d L和d U分别为1.270和1.563。因为0≤DW≤DL,模型存在正的自相关,需要对模型进行修订。
用科克伦-奥克特迭代法对自相关进行修订。,用SPSS软件,采用9次迭代法,对模型进行分析后,得到如下数据:
经过迭代后,基本消除了自相关。得到的模型如下所示:
5.异方差的检验与修正
分别做 与Y的散点图:
由图形可以看出:能源生产总量与Y不存在自相关关系,而GDP与Y几乎也不存在自相关关系。为了得到更确定的答案,还需要用G-Q检验法对模型进行异方差的检验。由残差平方与GDP的散点图,可知模型可能存在升序排列的异方差。所以对模型数据进行升序排列,排除中间四分之一的数据,分别对余下的数据进行回归分析,得到如下数据:
方差分析 | ||||
| df | SS | MS | F |
回归分析 | 1 | 1498745586 | 1.5E+09 | 271.1062 |
残差 | 9 | 49754337.26 | 5528260 | |
总计 | 10 | 1548499924 |
|
|
方差分析 | ||||
| df | SS | MS | F |
回归分析 | 1 | 15837859524 | 1.58E+10 | 905.3101 |
残差 | 8 | 139955216.8 | 17494402 | |
总计 | 9 | 15977814740 |
|
|
统计量
=139955216.8/49754337.26=2.81
给定显著性水平 =0.05,查F分布表,的临界值为F(0.05)(11,11)=2.82。因为2.81<2.82,所以认为模型中不存在异方差。
五、模型
本次分析一开始选择了比较多的变量作为分析依据,但是通过各种检验和调整,最终结果体现,影响能源消耗总量的主要因素有能源生产总量与GDP。能源生产总量是消耗总量的直接制约因素。GDP的增长是能源消耗总量曾长的根本决定因素。
所以最终确定的模型为经过科克伦—奥科特九次迭代法之后,得到的模型
同时,也得到了如下数据:
由以上数据可以看出:
可决系数R=0.994,表明样本数据与回归方程拟合优度很好。
能源生产总量系数的t值为 26.491,表明能源生产总量对能源消费总量由显著性影响。
可比价GDP系数的t值为1.332,t值不是很大,表明模型仍存在一定问题,但由于知识水平与技术的限制,我不能做出更好的调整,有待日后修复。
:
1.《统计年鉴2007》
2.《计量经济学》
3.《SPSS统计软件分析应用》
4.《中国日报》