前后测量设计资料中的个体生长问题

来源:岁月联盟 作者:杜晓晗,徐勇,陈长生 时间:2010-07-12

【关键词】  前后测量

    Problem of the individual change in pretestposttest design

  【Abstract】 AIM: To study the individual change over time in pretestposttest design. METHODS: Using the banting of obese children as an example, there were 2 groups: one is the treatment group with the obese children receiving drug to control weight, the other is the control group with the children of standard weight. At the age of 8 and 10, the weight was measured. The hypothesized mean of each group children weight was Y1(t1)=31.0, Y0(t1)=23.0, Y1(t2)=36.0, Y0(t2)=28.0. In the absence of treatment, the hypothesized mean Y1*(t2) was 41.0. RESULTS: Using simple gain scores to estimate the treatment effect, α=36.0-31.0-(28.0-23.0)=0 (kg), this indicated that after experiment the 2 groups were not different in children weight, and the treatment effect didnt exist. But the true treatment effect was  Y1(t2)-Y1*(t2)=36.0-41.0=-5.0(kg), which showed that the treatment effect existed and the children weight was different after treatment. CONCLUSION: The 4 kinds of individual changing trends in pretestposttest design show the problem of the individual change cant be ignored when we analyze the data of pretestposttest design.

  【Keywords】 pretestposttest design;individual change

  【摘要】 目的:探讨前后测量设计资料中伴随的个体生长现象. 方法:以肥胖儿童的减肥试验为例,假设有两组儿童,一组为处理组,该组儿童为肥胖儿童组接受减肥药物控制体质量;另一组为对照组,该组儿童为标准体质量儿童组,分别在8岁和10岁时测量儿童的体质量,假设两组儿童在试验前后体质量的均值分别为Y1(t1)=31.0, Y0(t1)=23.0, Y1(t2)=36.0, Y0(t2)=28.0,在处理组缺失干预时Y1*(t2)=41.0. 结果:用简单得分法估计处理效应, α=36.0-31.0-(28.0-23.0)=0(kg),说明两组儿童试验后的体质量无差异,处理效应不存在,但是真实的处理效应为Y1(t2)-Y1*(t2)=36.0-41.0=-5.0(kg),说明处理效应是存在的,即施加干预前后儿童的体质量有差别. 结论:了前后测量设计资料个体生长趋势的4种情况,提示我们在分析前后测量设计资料时个体自然生长问题不容忽视.

  【关键词】 前后测量;个体生长

  0引言

  前后测量试验设计(pretestposttest design)方法是医学科研设计中普遍采用的一种试验设计方法,因为这种设计方法考虑了各组试验前(基础值)的差别,并且试验前数据提供了更多个体差别的额外信息,降低了误差方差,提高了检验效能[1-2]. 但是这其中还有一个“隐藏问题”容易被忽视,即个体随时间的自然生长问题. 自然生长问题是生物界的,是不可避免的,医学试验的受试对象一般是动物个体或者人体,所以这一问题就必须要考虑. 例如,在高血压的自身前后对照临床试验中,对大多数成人来说,血压会随着年龄而增加,因此就存在一个潜在的“生长”问题. 即在不施加任何干预的情况下,血压值也会随年龄呈逐渐上升的趋势,这样在判定处理效应是否存在时就存在了混杂因素,有可能导致错误的结论. 所以个体的自然生长问题不容忽视[3]. 本文旨在对前后测量设计资料的个体生长问题进行深入的探讨.

  1材料和方法

  为了便于后面叙述的方便,在此规定: Y1=试验前(t1)的测量值, Y2=试验后(t2)的测量值,D=Y2-Y1(前后测量值的差值). Y1(t1)[Y0(t1)]是在t1时,处理(对照)组测量值的均值, Y1(t2)[Y0(t2)]是在t2时,处理(对照)组测量值的均值,Y1*(t2)是在时间t2时,处理组中假设没有施加干预时的测量值的均值. 处理效应定义为α,处理效应的估计值α=Y1(t2)-Y0(t2)-β[Y1(t1)-Y0(t1)],其中β是校正系数. 真实的处理效应α=Y1(t2)-Y1*(t2),在完全随机化的前后测量设计中,因为各组的受试对象被随机分配到各试验组内,所以Y0(t2)=Y1*(t2),那么Y1(t2)-Y0(t2)就是α的无偏估计值;但是在实际情况中,由于试验前的混杂,此无偏估计值就不是“无偏”的了,又因为Y1*(t2)无法得到,所以采用简单得分法估计处理效应, β=1,那么α=Y1(t2)-Y0(t2)-[Y1(t1)-Y0(t1)].
   
  下面以肥胖儿童的减肥试验为例,说明潜在的个体生长问题. 假设有两组儿童,一组为处理组,该组儿童为肥胖儿童组接受减肥药物控制体质量;另一组为对照组,该组儿童为标准体质量儿童组,分别在8岁和10岁时测量这两组儿童的体质量,假设两组儿童在试验前后体质量的均值分别为Y1(t1)=31.0, Y0(t1)=23.0, Y1(t2)=36.0, Y0(t2)=28.0, Y1*(t2)=41.0,如图1所示.

  图1两组儿童体质量的前后测量值的均值(略)

  2结果

  从图1可以看到,如果在处理组缺失干预的情况下,该组儿童在10岁时的平均体质量是41.0(kg),在施加干预的情况下体质量是36.0(kg). 如果我们用简单得分法估计处理效应,α=36.0-31.0-(28.0-23.0)=0(kg),说明两组儿童试验后的体质量无差异,处理效应不存在,但是真实的处理效应为Y1(t2)-Y1*(t2)=36.0-41.0=-5(kg),说明处理效应是存在的,即施加干预前后儿童的体质量有差别. 为什么简单得分法会产生这5 kg的误差呢?从图1中可以看到,两组儿童由于自然生长问题,在7岁时的体质量差别不大,而到8岁时两组儿童的体质量差别就趋于明显,但仍旧是各组的体质量都随年龄而增加,在缺失干预的情况下,两组的差别逐渐加大,呈“扇行发散”形状. 当处理组施加干预时,致使处理组曲线上升趋势较慢,所以两组儿童在10岁之后有逐渐平行且相交的趋势,说明减肥药可以控制肥胖儿童的体质量.


   
  在图1中真实的处理效应被掩盖了,原因就在于没有考虑其内在的个体生长问题,一方面儿童的体质量会随着年龄的增加而增高,也就是说即使不施加任何干预,儿童的体质量也是10岁比8岁时会高些;另一方面,图中显示处理组施加干预时的曲线的上升速率比生长时要慢,这说明处理效应还是存在的,即施加干预对于肥胖儿童体质量的控制是有益的. 但是我们用简单得分法不足以发现其中存在的差别,所以在两组测量前基线值有差别时,尤其不可忽视个体自然生长这一潜在问题.
   
  如果做更进一步的考虑,可以把前后测量设计资料两组的自然生长问题概括为图2的4种情形[4-5],此时假定两个试验组都未施加任何干预,并且个体随时间的生长轨迹都呈线形趋势,从图中可以看到,四种情况下两组在试验前的基线值有差别,但是试验前的差值Y1(t1)-Y0(t1)相等,但是他们的个体生长趋势各不相同. A显示两组的生长曲线相互平行,说明两组个体的生长趋势一致,那么此时简单得分估计的处理效应就是真实的处理效应;B显示两组的生长曲线随时间逐渐靠拢, C显示两组的生长曲线逐渐发散,D显示两组的生长曲线先相交后发散,后三种情形下用简单得分法估计的处理效应就不等于真实的处理效应.

  但是在前后测量设计中,通常无法得到Y1*(t2)的值,因为无法让处理组的个体在固定的一段时间内既接受处理又不接受处理,所以真实的处理效应在理论上是无法得知的;那假设Y1*(t2)的意义何在?一是为了便于说明个体生长问题在前后测量设计中是确实存在的,试验者在试验设计时不应忽视这一问题;二是可以为前后测量设计资料如何选择合适的统计分析方法提供有益的启发和帮助.

  图2生长趋势的四种情况(略)

  3讨论

  个体生长问题最早发源于心研究中,因为心理学研究的问题多数伴随有个体生长问题,并且是必须予以考虑的,但是医学中的个体生长问题虽在很早以前已经提出但是未被予以足够重视,一方面是因为医学试验中前后测量设计的前后时间间隔较短,此时的生长问题可以忽略不计;另一方面,当生长问题掩盖了处理效应时,资料的统计学处理方法就比较复杂,此时需考虑校正的问题[6],因为生长问题并不一定是简单的如图2所示的4种简单的线性关系,所以通常的线性分析方法无法满足要求,试验者就刻意避开这一问题.

  以前面提到的高血压问题为例,成人的血压值一般随着年龄增高,并且血压的变化是逐渐变化的过程,如果治疗后的测量与治疗前相隔时间很短,例如只有1至两个月时间,那么就可近似认为生长问题不对处理效应构成影响. 但是如果是偏重于血压的行为学校正研究,通常前后测量的间隔时间较长,一般常为5至10年,那么此时个体的生长问题必须要考虑,涉及的统计分析方法也比通常采用的方差分析,协方差分析方法更为复杂.
本文阐述了医学中的前后测量设计时伴随的个体生长问题,让研究者对某些与时间有关的非处理因素的影响引起注意,并且在下结论时也应慎重,或者为新的统计方法的提出提供一些依据.

  【】

  [1] Bonate PL. Analysis of pretestposttest designs [M]. Boca Raton: Chapman & Hall, 2000:135-142.
  
  [2] Collins LM. Is reliability obsolete? A commentary on “Are simple gain scores obsolete?”[J]. Appl Psychol Meas,1996,20: 289-292.

  [3] Jamieson J.Dealing with baseline differences: Two principles and two dilemmas[J]. Int J Psychophysiol,1999,31:135-151.

  [4] MacCallum RC, Kim C, Malarkey WB, et al. Studying multivariate change using multilevel models and latent curve models[J]. Multivariate Behav Res, 1997,32:215-253.

  [5] 孙振球,徐勇勇.医学统计学[M].北京:人民卫生出版社,2002:200-203.

  [6] Cribbie RA, Jamieson J. Decreases in posttest variance and the measurement of change[J]. MPROnline, 2004,9(1):37-55.