基于马尔可夫链系统的上证指数探讨

来源:岁月联盟 作者:肖泽磊 卢悉早 时间:2010-06-25
摘 要 从实证的角度讨论了我国股票市场中上证指数的趋势,根据使用马尔可夫模型的前提条件和马尔可夫模型的相关性质,将上证指数分为高跌、低跌、低涨和高涨四种状态,运用马尔可夫链求解公式,探讨我国的股票价格涨跌趋势,寻找行情变化,为投资者提供相关的模型。
  关键词 马尔可夫链 上证指数 模型 矩阵

  在市场方面,的股票市场虽然经过十几年的发展取得了长足的进步,但是还不够成熟,突出表现在证券市场功能以筹资为主,优化资源功能相对较弱;上市公司普遍存在重筹资轻转制的倾向;多数公司还没有形成有效的内部制衡机制,市场规模较小,相对法规不完善,监督力量薄弱和监管滞后等,因此中国的股票市场呈现出独特的规律,是中国股票市场的波动有着自己与众不同的特点,但是作为投资者来说,最大的兴趣就是能够对股票价格做出领先一步的预测,而近期的研究表明,可以通过对股票价格的分析来预测未来价格,本文旨在通过马尔可夫链的相关方法,对我国股票市场进行实证研究,探讨我国股票市场的股票价格涨跌趋势,寻找我国股市行情变化的规律,为投资者提供相关的参考模型。
1 马尔可夫链的数学原理和基本特性
1.1 马尔可夫链
  假设随机过程{X(t),t∈T},若对任意的0   P{X(t)}=j|X(t)=in,u;t以前各时期的状态和决策}
     =P{X(t)}=j|X(t)=in,u     (1)
  则称{X(t),t∈T}具有马尔可夫性,in, u表示第n个时期的状态和决策。
  具有马尔可夫性的随机过程就被称为马尔可夫链。马尔可夫过程{X(t),t∈T}所可能取的值的全体成为过程的状态空间。若状态空间是离散的,则此马尔可夫链就可列(状态)的马尔可夫链。如果状态空间是有限,则称此马尔可夫链为有限的马尔可夫链。
1.2 马尔可夫链的基本特性
  (1)通过(1)式可以看出具有马尔可夫性的随机变量X(tn+1)所处的状态仅与随机变量所处状态有关,而与前期随机变量X(tn)所处状态无关。
  (2)平稳分布性。即具有马氏链的状态概率分布{?浊(i),i∈I},一定满足
   ?浊(i)=?浊(j)P            (2)
  其中,Pij该随机过程的状态转移矩阵,I为状态空间的集合。
  (3)遍历性。即系统无论从那个状态出发,经过足够长的时间后,系统处于的状态j的概率一定稳定在n(j),j=0,1,2…S,用数学公式表达就是
   P=?浊(j)               (3)
  从另一角度来理解(3)式,说明无论随机过程系统从哪一个状态出发,当转移的步数?茁充分大时,转移到状态j的概率近似与某一个常数?浊(j)。
  由此性质我们可以得到,具有马尔可夫性的随机过程{X(t),t∈T},状态转移概率?浊(j)是方程组?浊(j)=?浊(i)P在满足条件?浊(i)>0和?浊(i)=1的唯一解。
  (4)状态相通性。即具有马尔可夫性的过程无论系统初始状态,通过有限的转移步数,一定可以到达同一个状态。用数学表示就是随机过程{X(t),t∈T},无论其初始状态是i或者j,经过一定步数?茁1和?茁2一定可以到达k状态,只是转移的方向和步数不同。
2 运用马尔可夫链模型对上证指数进行实证分析
2.1 数据选取和处理
  考虑到本文在很大程度上将不是最终研究成果,更多的是一种试探性研究,所以,本文选取的数据为中国股票市场上证指数(SCI)从2000年11月16日到2001年1月15日共42个交易日的收盘价样本数据,将每日收盘价按照上下10个点对当天的状态定义为高跌、低跌、低涨和高涨四种状态,用历史的数据来验证模型的有效性,并用后续股票指数的实际发生状况来验证模型的精确度。
2.2 构件马尔可夫链模型
  我们令x1,x2,x3,x4分别代表高跌、低跌、低涨和高涨四种状态,状态空间   I={ x1,x2,x3,x4}在42个交易日中,四种状态出现的次数分别为x1=8, x2=14, x3=8, x4=11;pi表示各个状态出现的概率,状态变量用各个状态出现的概率来表示即?浊(j)={ p1,p2,p3,p4}; pij表示状态i变化到状态j的概率;用P来表示状态转移矩阵,即
P=
=
=
  由于在第42个交易日中,股票指数的状态为高跌,而没有发生状态转移,所以我们高跌的次数为7次。以保证该过程能够满足马尔可夫链的相关条件Pij>0且P=1,即转移矩阵的每一横行的数的和为1。
  计算多步转移矩阵得到,通过计算P2,P3……并观察其趋势,我们可以得到:
 P==

2.3 根据马尔可夫模型对我国股票指数做短期预测
  根据马氏链的原理,第n+1时期的状态向量可以用n期的状态向量来表示,即:
     ?浊(j+1)=?浊(j)·P1           (4)
  利用前面所得到的上证指数的各步转移矩阵,我们可以对上证指数2001年1月15日以后的上证指数的趋势做短期预测判断。由于我们一共收集到42个数据样本,且1月15日的状态为高跌,所以我们将当日的状态向量为?浊(42)=(1,0,0,0),根据(4)式,我们得到16日、17日上证指数的发展趋势。
  ?浊(43)=?浊(42)·P1=(0.1429,0.4286,0.2856,0.1429)
   ……  
  ?浊(n)=?浊(n-1)·P1=(0.1992,0.3292,0.2017,0.2709)
  从上面的结果我们可以得到,第43个交易日即2001年1月16日,上证指数仍将维持下跌的趋势,但是下跌的幅度将有所遏制,将是小幅度下跌。我们观察接下来的两个观察日的状态概率向量,上证指数曾现明显的反弹的迹象,因为上涨的概率明显优于下跌的概率,说明上证指数短期内会有回调的压力。通过后来的数据进行检验,证实了我们推测结果的正确性,说明该马尔可夫预测模型有一定的可信度。
2.4 根据马氏链计算上证指数的收盘状态
  根据马氏链的性质和公式(2),我们可以求出在稳定状态下上证指数的状态向量概率。
  (x,x,x,x)·=
  (x,x,x,x)               (5)
  x+x+x+x=1               (6)
  联立(5),(6)解得:
   x=0.1992x=0.3292x=0.2017x=0.2709
  可以看出,稳定状态下计算出得收盘状态概率值与递推公式推导的一致。通过以上结果,随着交易日的不断进行,在相关外部环境不发生大的改变时,沪市最终会以19.92%的概率高跌,32.92%的概率低跌,20.17%的概率低涨,27.09%的概率高涨保持相对稳定的局面。而事实上的上证指数在至它诞生4 000多个日子里,上指起伏跌荡,但总趋势还是呈现出一种慢慢下跌的趋势,这一点可以从近些年的沪市相关数据上得出,这与模型中低跌发生概率较高相同。但从另一个角度看,但涨与跌的次数基本上是接近的,这就说明上证指数具有一定的波动性,因此在股票市场只有能“随机就市”,才能把握先机。
3 结束语
  本文通过将股票指数根据其涨幅的程度分为四种状态,并成功运用马尔可夫链的相关性质对上证指数走势的概率进行短期分析,实证分析也说明了该马尔可夫模型在股票价格指数的走势预测上的应用前景相对光明,同时,我们也可以将此模型进一步推广到对其他行业或者某个公司相关财务、市场等指标的运行情况进行预测等等。当然该模型也存在许多值得我们进一步研究的问题,如何运用马尔可夫链模型进行长期的预测及其前提条件等,我们将在以后作讨论。

1 邹新月.深圳综合指数增长相关性特征分析及其预测[J].管理,2002(2)
2 付昱华,付安捷.用分形方法预测石油股票和指数[J].中国海洋平台,2002(6)
3 边延亮,张洁.运用马尔可夫链模型预测沪综指走势[J].统计与决策,2004(6)