改进的RBF神经网络对期货价格的预测分析

来源:岁月联盟 作者:申畯 申荣华 时间:2010-06-27
  摘 要:针对非线性变化的期货价格,建立了基于主成分分析的RBF神经模型。首先利用主成分分析法从8个原始变量中提取主成分,最后利用选定的3个主成分作为径向基神经网络的输入。通过对比,该方法较一般的径向基神经网络有更好的预测结果。?
  关键词:期货;主成分分析;RBF神经网络;预测 ?
  
  1 引言?
  
  在对实际问题进行描述和处理中,为了能够获得更加全面的信息,我们经常需要统计多个变量的数据。但是这些多个变量之间经常存在一定的相关性,并不是每个变量都是我们所需要的,或者说它们携带的信息可能是重复的。因此我们希望用少数几个变量来代替原有的多个变量。主成份分析法的基本思想就是通过对原始数据的降维,将多个相互关联的变量转化为少数几个互不相干的变量的统计方法。?
  由于期货价格的变化是一个非线性的时间序列,利用传统的统计方法对期货的价格直接进行预测,所得到的结果不是很理想。而神经网络在非线性模式中具有优势,因而它不需要建立复杂的数学模型就可以完成期货价格预测。基于BP网络和RBF网络的预测都有较好的结果,但是相对BP网络而言,利用RBF神经网络不仅解决了常用BP网络易陷入局部最小的问题,而且训练时间更短,预测的精度也比BP网络高得多。本文提出使用基于主成分分析法的RBF神经网络方法对期货价格进行预测。通过主成分分析法对原始数据降维,然后,再用这些个数较少的新输入变量作为RBF神经网络的输入进行模拟预测。由于主成分之间是相互独立的,所以由各主成分组成的输入空间不存在自相关性,从而有效地简化了RBF网络在高维时难以寻找网络中心的问题,提高了预测精度。?
  
  2 主成分分析法简介及RBF神经网络算法概述?
  
  2.1 主成分分析法?
  主成分分析法的步骤如下:?
  (1)原始数据的标准化处理。??
  主成分分析法的目的就是使用较少的变量代替并综合反映原来较多的信息,综合后的变量就是原来多变量的主要成分,利用这些综合后的主要成分去代替原来的变量去解决实际问题。这里首先利用以下公式对原始变量进行标准化处理。其中原变量为x??ij?,其含义为第j个变量的第i个值,则处理后的变量值为y??ij?,?
 
  
  (3)矩阵R的特征根和特征向量。?
  利用R的特征方程|R-λ?i|=0求出其特征根,其对应的特征向量利用|R-λ?i|A=0和AA'=1求得。然后对所求得的特征根按照大小顺序进行排列。?
  (4)计算方差贡献率与累计方差贡献率。?
  利用公式K?i=λ?i/∑ni=1代入所求的特征根λ?i,求出各个主成分的贡献率K?i,其贡献率就代表了原数据信息量的百分比。?
  (5)确定主成分计算其得分值。?
  主成分的确定方法主要有两种:(1)当前K个主成分的累计贡献率达到某一特定值的时,则保留前K个主成分。一般采用超过85%以上。(2)选取特征值大于1的主成分。这两种可视情况进行选取,一般前者取得主成分要多,后者要少,通常情况下是将两者结合一起来进行使用。?   2.2 RBF神经算法概述?
  径向基(RBF)网络是以函数逼近理论为基础构造的一类向前网络。其网络结构为三层,隐含层采用高斯函数为激励函数,理论上,只要隐含层中有足够的径向基神经元,径向基函数网络就可以逼近任何非线性函数。输出层为简单的线性加权函数,其网络结构如图所示。?
  
  其中W1?i为每个隐含层神经元与输入层相连的权值向量,X?q为输入矢量,b?1?i为阈值。则隐含层的第i个神经元的输入为:?
  k??q??i=?j(w1??ji?-x?q?j)?2×b1?i?
  输出为:?
  r?q?i=exp((-k?q?i)?2)=exp(-(||w1??ji?-X?q||×b1?i)?2)?
  输出层的输入则为各隐含层神经元的加权求和。由于激励函数为线性函数,因此输出为:?
  y?q=∑ni=1r?i×w2?2?
  RBF网络首先通?过无教师学习确定训练输入层与隐含层间的权值w?2。再通过有教师学习,确定训练隐含层与输出层间的权值w1?i。在RBF网络训练中,隐含神经元的数量确定是一个关键的问题。其基本原理是从0个神经元开始训练,通过检查输出误差使网络自动增加神经元。每次循环使用,使网络产生的最大误差所对应的输入向量作为权值向量w1?i,产生一个新的隐含层神经元,然后检查新网络的误差,重复此过程直到达到误差要求或最大隐含层神经元为止。由此可见,径向基函数网络具有结构自适应确定、输出与初始权值无关等特点。?
  
  3 改进的RBF神经网络对期货价格的实例预测?
  
  3.1 主成分分析?
  期货的价格是受很多因素影响,如国家政策、季节气候、供求关系、战争等,所以其价格会上下波动,呈现出一个非线性时间序列。其交易价格本文选取2007年6月7日至8月29日燃油0801每个交易日的开盘价、最高价、最低价、收盘价、交易量、持仓量、前5日均价、前10日均价为初始变量,每个变量60个数据,前59个为训练样本,最后一个为检测样本。考虑到期货交易与股票交易的不同,其交易方式是双向交易,从投资者获利的角度考虑,其并不像股票市场一样单纯的考虑股票价格增长,加上每个星期正常的期货交易日仅为5天,所以在这里我们考虑选取后5日均价作为预测目标,这样的选择更有实际意义。在这里本文直接利用SPSS软件包,选择数据降维,再选用主成分分析,可以直接得到各个主成分的方差累计贡献率,如表1所示:?
  从表中我们可以看出,第一个主成分主要包含了开盘价、最高价、最低价、收盘价、以及前5日均价共五个变量的信息,第二个主成分主要包含了成交量和持仓量两个变量的信息,而第三个主成分则主要包含了前十日均价一个变量的信息。由此可以看出,通过数据降维,将原来的8个变量,转化为现在的3个变量了。?
  3.2 神经网络的设计及训练?
  现设计一个三层的神经网络,输入层有3个神经元,输出层神经元为1个。利用下式对输入、输出值进行标准化,可使得输入、输出值其均落在[-1,1]区间。?
  x?n=2*(x-min?x)/(max?x-min?x)-1?
  在mat lab 的神经网络工具箱中用newrb函数设计这个径向基函数网络,用其作函数逼近时,可自动增加隐含层神经元,直到达到均方误差为止,利用语句:net=newrb(P,T,GOAL,SPREAD)进行网络设计,其中GOAL为均方误差,这里取值为0.0001,SPREAD为径向基函数的扩展速度,其值越大,函数的拟合就越平滑。经过试验,当其取0.058时,其预测效果最好。把2007年6月7日至8月28日的燃油0801选定的主成分作为输入的训练样本,标准化的后5日均价的值作为输出的训练样本,8月29日的数据作为测试样本,结果如下:?
  
  4 结语
  ?
  由此可看出基于主成分分析法的径向基神经网络较一般的径向基网络有更简洁的网络结构,对于相对比较复杂的期货价格预测,基于主成分分析法的径向基神经网络得到的结果也更加精确。不过径向基神经网络本身对扩展速度的选择没有一个固定的标准,不同的值得到的结果有较大的偏差,这是该网络的一个缺陷,也是今后研究的一个方向。?
  
  ?
  [1]?黄颖,白玫,李自珍.基于主成分-BP神经网络的期货市场预测[J].数学的实践与认识.2007,(7):23-26.?
  [2]?刘兴彬,万发祥.RBF神经网络主成分分析法在量预测中的应用[J].山西科技,2001,(1):54-56.?
  [3]?茆诗松.统计手册[M].北京:出版社,2003:559-561.?
  [4]?飞思科技产品研发中心.神经网络理论与MATLAB实现[M].北京:出版社,2005:117-119.