非线性混合效应模型在交叉设计等级资料分析中的应用

来源:岁月联盟 作者: 时间:2010-07-12

                    作者:陈卫中,杨晓虹,陈朝琼,杨翔

【摘要】  Objective To explore the application of nonlinear mixed models in ordered categorical data of cross-over trial analysis and hence provide methodology reference.Method An example was illustrated by modeling nonlinear mixed models using the NLMIXED command of SAS.Results All parameters and their standard error were estimated,so every factor could be intuitionisticatty interpreted.Conclusion When subjects were estimated as random effects,not only the accuracy of the estimation was improved,but also covariates,such as the center,age,gender and baseline could be taken into consideration.The method could also deal with data with missing values and without deleting these observations,it is useful in ordered categorical data of cross-over trial analysis.

【关键词】  nonlinear mixed models;cross-over trial;ordered categorical data


    交叉试验(cross-over trial)是指按事先设计好的试验次序,在各个时期对研究对象(subject)逐一实施各种处理,以比较各处理组间的差异,是将自身比较和组间比较设计思路综合应用的一种设计方法[1]。它克服了实验前后自身对照由于观察期间各种非实验因素对实验结果的影响所造成的偏倚,同时节约样本含量[2],主要适用于来源较困难、个体差异较大的动物(如牛、猴等)或人类医学、心等试验。临床上多用于评价可缓解症状但无根治作用药物的疗效,如止痛、镇静、抗风湿、降血压、抗失眠药物等的疗效比较。在资料的统计学分析方法选择上,由于混合效应模型去除了方差分析中所有变量,尤其是个体变量作为固定效应被估计,而导致检验效能降低,以及无法在模型中增加其它混杂因素,例如中心效应、年龄、性别、基线等的限制[3],而且广义混合效应模型不仅可以分析定量资料,而且也适用于二分类资料,在交叉设计的统计分析中越来越受到关注。但许多资料的结果指标为有序多分类,如临床化验结果为“-、±、+、++、+++”,疗效评价为“痊愈、显效、进步、无效”等,有关该类型资料的分析报道较少。本文以最常用的2×2交叉设计为例,探讨非线性混合效应模型(nonlinear mixed models)在交叉设计等级资料分析中的应用。

    1  模型简介

    非线性混合效应模型[4~7],是线性混合效应模型的一种扩展,其固定效应和随机效应部分均可以以非线性的形式纳入模型,相对于线性模型的正态假定,非线性模型对资料的分布无特殊要求,资料可以是正态,也可以是二项分布、Poisson分布等。非线性混合效应模型可作如下表述:

    yij=f(xij,?i)+eij

    ?i=Aiβ+Bibi(1)其中,yij为第i个体第j次测量预测值,或经过某种单调联系函数(link function)转换的期望值;f(·)为非线性函数,如果其为线性,则退化为线性的混合效应模型;xij为p维解释变量向量;eij为独立正态分布随机误差向量;β为p维固定效应参数;bi为随机效应因子;Ai、Bi为已知的设计矩阵。其参数估计可以通过伪数据步(pseudo-data step)和线性混合效应步(linear mixed effects step)两步之间的迭代完成,可分别使用Gauss-Newton迭代法和EM算法解决。

    2  应用实例

    2.1  资料来源为评价某公司开发的新药盐酸哌罗匹隆精神分裂症的疗效,以氯丙嗪为对照,将所有患者随机分为两组,一组患者先服用盐酸哌罗匹隆,再服用氯丙嗪;另一组患者顺序相反,即先服用氯丙嗪,再服用盐酸哌罗匹隆,每个阶段用药3周,期间清洗期(washout time) 2周,进行多中心的2×2交叉设计试验,共纳入病例200例,分别在5个中心进行。主要结果指标疗效为每阶段结束后,按照PANSS总评分的变化情况将疗效划分的4个等级,即基本痊愈、显著进步、好转和无变化,分别赋值为1、2、3、4。

    2.2  方法以疗效为应变量,药物(treat)、顺序(sequence)、阶段(period)、中心(center) 为解释变量,其中中心仍然纳入为固定效应,并将5中心作为参照组,以哑变量的形式纳入模型,分别表示为c1、c2、c3、c4;个体(subject)以随机效应的方式纳入,建立非线性混合效应模型。其模型参照Harville[8]提出的模型构造,基本形式为:

    yij=β0+β1treat+β2sequence+β3period+β4c1+β5c2+β6c3+β7c4+ui+eij(2)其中yij并不是疗效等级,而是将疗效视为存在某潜在连续变量的yij,在分析中看某个体是否落在(-∞,0)、(0,I1)、(I1,I1+I2)、(I1+I2,+∞)的4个区间中,I1、I2均为正数。

    2.3  结果所有分析过程在SAS软件包中完成,所建立的模型在经过20次迭代后收敛。结果显示:组别和次序的差别均无统计学意义;阶段和中心效应的差别有统计学意义,第二阶段的疗效好于第一阶段,1、2、3中心的疗效好于5中心,而4中心疗效差于5中心,随机效应的标准差为1.0587,并有统计学意义。具体拟和结果参见表1。表1  模型中各参数拟和结果

    3  讨论

     对于交叉设计中等级资料的统计分析方法,相关研究报道较少,比较常见的处理方法是在同一个体内部将两阶段的观察结果编秩后求秩差,然后利用秩和检验等来检验不同次序间的差别,从而间接的反映处理因素的效果[9],但在试验中,存在很多的混杂因素,影响试验结果,有些是可以识别的,可以在试验的设计阶段加以控制,但有些时候混杂因素在设计阶段由于客观条件的限制并不能有效控制,这就要求在统计方法的选择上考虑这些因素,以真正显示处理因素的效果,而上述方法在控制协变量问题上却无能为力,同时对于3×3或更高维度交叉试验的分析处理变得复杂;也有报道[10]使用Cochran-Mantel-Haenszel χ2检验完成统计分析,其同样不能控制混杂因素,同时该方法将个体视为分层因素,即固定效应进行分析是不合适的,因为毕竟试验对象不过是总体中的一个样本。而混合效应模型很好地弥补了以上弱点,可以按需要纳入协变量,比如本次研究中的中心等,使结论更加准确。同时混合效应模型在对缺失数据的处理上具有很好的稳健性。而且非线性的混合效应模型是线性混合效应模型的扩展,其适应性更强,使用范围更加广泛。此外,诸如本资料中的中心因素,当中心数比较多(如>10)时,同样可以考虑按随机效应的形式纳入模型。对于本资料,如各处理组内部还存在时点上的重复测量,亦可将其纳入,以综合评价组间的差异,同时还可以探讨时间和组别的交互作用。上述模型可以在SAS中调用PROC NLMIXED实现。

【文献】
  [1] 苏炳华,何清波.交叉试验计量资料分析的SAS程序[J].卫生统计,1997,14:52.

[2] 倪宗瓒.医学统计学[M].北京:高等出版社,2003:106-107.

[3] 赵杨,于浩.交叉设计多中心临床试验的混合效应模型[J].中国临床药与治疗学,2005,10(1):116-120.

[4] Davidian M,Giltinan DM.Nonlinear Models for Repeated Measurement Data[M].London:Chapman and Hall.1995:10-25.

[5] SAS Institute Inc.SAS OnlineDoc:Version 7-1[M].1999:67-144.

[6] Lindstrom MJ,Bates DM.Nonlinear Mixed Effects Models for Repeated Measures Data[J].Biometrics,1990,46,673-687.

[7] 沈曦.重复测量数据非线性混合效应模型的统计诊断[D].东南大学硕士,1999:3-9.

[8] Harville DA,Mee RW.A Mixed-model Procedure for Analyzing Ordered Categorical Data[J].Biometrics,1984,40:393-408.

[9] Díaz-Uriarte,R.The Analysis of Cross-over Trials in Animal Behavior Experiments:Review and Guide to the Statistical Literature[J].Samizdat,2001:8-9.

[10] Robert J,Gallop J,et al.Methods for the Analysis of Clustered Ordinal Response Data[EB/OL].http://www.nesug.org/html/Proceedings/nesug00/st/st9005.pdf.