非虚假设IV期临床试验的设计与分析

来源:岁月联盟 作者: 时间:2010-07-12

         作者:程豪为 孙爱民 赵国龙 

【关键词】  非虚

  摘要:目的:论述非虚假设IV期临床试验的设计与分析。方法: 按对照差与最小可识别差量的比较建立非虚假设。将临床试验的每个中心看作一个层,以层样本分数为权作加权平均得综合治疗对照差及其期望和方差。由此构造非虚假设分层设计基本关系式,进而推导出非虚假设IV期临床试验所需样本量和检验统计量。以 Monte Carlo 方法展示其行为。结果: 当最小可识别差量取零时,它还原为传统的虚假设IV期临床试验所需样本量和检验统计量,其观测功效与预定功效吻合。结论: 这种临床试验可用于建立试药对于有效对照的临床优效性或非劣效性。

  关键词:有效对照;临床试验;MonteCarlo 方法;非虚假设;分层                                                         
  1 引言

  在非虚假设下可对药物疗效作出更为合理的解释[1~5],这对临床试验的设计、执行和分析提出了更高要求[6,7]。其突出特点是采用有效对照[8~10],以建立试药对于有效对照的临床优效性或非劣效性[11~16]。IV期临床试验着重用于药物上市后评价,一般按样本与总体比较进行统计推断。近年临床试验大多采用多中心方式,每个中心常被看作一个层,用随机化前分层设计,结果形成分层数据。

  为满足非虚假设IV期和多中心的要求,本研究构造非虚假设分层设计基本关系式,进而推导出这种临床试验的设计与分析方法,并以实例说明用法。

  2 原理

  临床试验的主设计参数是治疗对照差μ。它通常是某临床指标,如比例 (率) 或均数,在样本与总体或试验与对照组之间的差别。设最小可识别差量为Δ,治疗对照差在|μ|≥|Δ|时被解释为临床可识别的,在|μ|<|Δ|时则否。按μ与Δ的比较建立非虚假设H:μ=Δ及其对立假设Ha:μ>Δ或μ<Δ(单侧)。当Δ>0时,这分别对应于临床优效性 (clinical superiority trial) 或非优效性试验 (clinical nonsuperiority trial); 当Δ<0时, 这分别对应于临床非劣效性 (clinical noninferiority trial) 和劣效性试验 (clinical inferiority trial); 当Δ=0时, 这还原为统计优效性或劣效性试验。在后一种场合, H 还原为虚假设H0:μ=0。当然, 对立假设亦可为μ≠Δ(双侧)。

  在分层设计的临床试验中,总样本量N分为I层。第 i 层,i=1,…,I,样本量为QiN ,Qi是层样本分数,∑iQi=1。设各层观测的治疗对照差Xi 相互独立, 来自同一总体,其期望是E(Xi)=μ,方差为Var(Xi)=Σi2=σi2/(QiN),σi2是个体测量值的方差。观测的综合治疗对照差定义为X=∑iQiXi,即Xi以Qi为权的加权平均。其期望仍是E(X)=μ,方差为Var(X)=Σ2=∑iQi2Σi2=1 N∑iQiσi2,简写为Σ2=σ2/N,σ2=∑iQiσi2。

  若 H为真, 期望为E(X)=Δ,方差写成Σ*2=σ*2/N,X 的抽样分布接近正态,
fX(x;Δ,Σ*2)=1  Σ*2πexp-1 2X-Δ  Σ*2 在Ha下为fX(x,μ,Σ2)。I 型错误概率α的正态离差是z1-ε,II 型β的是z1-β 。令x(z1-α)是α水平 X 的临界值(critical value), 得x(z1-α)=Δ+z1-αΣ*和x(z1-α)=μ-z1-αΣ。 若H为真,N宜满足〖JF(D〗x(-z1-α)   -∞  fX(x;Δ,Σ*2)dx〖JF)〗=〖JF(D〗∞x(z1-α)  fX(x;Δ,Σ*2)dx〖JF)〗=α若Ha为真,宜满足〖JF(D〗x(-z1-α) -∞ fX(x;μ,Σ2)dx〖JF)〗=〖JF(D〗∞ x(z1-α) fX(x;μ,Σ2)dx〖JF)〗=1-β

  由此可见,Δ+z1-αΣ*=μ-z1-αΣ 。这可转换为|μ-Δ|=z1-αΣ*+z1-βΣ 或|μ-Δ|=z1-ασ*/N+z1-βσ/ N或|μ-Δ|=z1-α1 N∑iQiσi*2+z1-β1 N∑iQiσi2(2.1)

  这就是非虚假设分层设计基本关系式。由此可解出样本量N=z1-α∑iQiσi*2+z1-β∑iQiσi2 μ-Δ2 (2.2)
为检验 H 的统计量基于Σ*2。设Σ*2=σ*2/N估计为S*2=s*2/N得Z=(X-Δ)/S*或
Z=∑iQiXi-Δ/1 N∑iQisi*2,Z~(0,1)(2.3)

  这就是用于分层数据的非虚假设检验通式。

  对于双侧,z1-α宜写成z1-α/2。在这些场合,(2.1)~(2.3) 式稍有变动。

  3 方法

  有效对照通常指标准疗法,其疗效明确并得到公认。比方说病人对它的应答比例已知是ξi,试药应答比例预期为πi,疗效改进即治疗对照差是μ=πi-ξi, 应答频数为πiQiN。若 H 为真,应答比例为πi*=ξi+Δ,应答频数为πi*QiN。离差为πiQiN-πi*QiN=QiN(πi-πi*)。

  设πi由样本估计为pi, 观测的治疗对照差为Xi=pi-ξi,观测的应答频数为piQiN, 观测的离差为QiN(pi-πi*)。若 H 为真,按二项分布理论,pi的方差为var(pi)=πi*(1-πi*)/(QiN)。给定ξi和Δ得var(Xi-Δ)=var(pi-ξi-Δ)=var(pi)。由Xi-Δ=pi-ξi-Δ=pi-πi*,可知var(pi-πi*)=var(Xi-Δ),故有离差的方差(QiN)2var(pi-πi*)=QiNπi*(1-πi*)。若Ha为真,同样可推导出(QiN)2var(pi-πi*)=QiNπi(1-πi)。取各层离差的和及其方差的和按 (2.1)式导出∑i(QiN|πi-πi*|)=z1-α∑iQiNπi*(1-πi*)+ z1-β∑iQiNπi(1-πi)简化为:|μ-Δ|=z1-α1 N∑iQiπi*(1-πi*)+ z1-β1  N∑iQiπi(1-πi)(3.1)

  这就是非虚假设单样本分层设计基本关系式。对比(3.1)和(2.1)可以看出,σi*2=πi*(1-πi*),σi2=π(1-πi)。这可转换为样本量测定公式:N=z1-α∑iQiπi*(1-πi*)+z1-β∑iQiπi(1-πi)  μ-Δ2 (3.2)这用于非虚假设IV期临床试验的设计。为检验 H 的统计量是:Z=∑iQiXi-Δ  1 N∑iQiπi*(1-πi*), Z~N(0,1)(3.3)
这用于非虚假设IV期临床试验的分析。

  4   应用和结果解释

  这种临床试验着重用于建立试药对于有效对照的临床优效性或非劣效性。先按虚假设作预分析,当具有统计学意义时再按非虚假设正式分析。没有统计学意义时,需按非虚假设另行设计临床试验,然后正式分析。假设和统计量的写法在不同应用场合略有不同。

  第1种场合:预设μ与Δ或-Δ差别的方向,用单侧检验,这里Δ、-Δ的绝对值可以不同。写法有4种:① 临床优效性试验:假设为H:μ≤Δ,Ha:μ>Δ,统计量为Z=(X-Δ)/S*;② 临床非优效性试验:H:μ≥Δ, Ha:μ<Δ,Z=(X-Δ)/S*;③ 临床非劣效性试验:H:μ≤-Δ,Ha:μ>-Δ,Z=(X+Δ)/S*;④ 临床劣效性试验:H:μ≤-Δ,Ha:μ<-Δ,Z=(X+Δ)/S*。其中,①、③ 常用。对于 ①,若H被拒绝,且X>Δ,则有利于试药优效于有效对照的解释。对于 ③,若H被拒绝,且X>-Δ,则有利于试药非劣效于有效对照的解释。并用 ②、③可建立临床等效性。若两个非虚假设均被拒绝,则有利于试药与有效对照具有临床等效性的解释。 

  第2种场合:预设|μ|与|Δ|差别的方向,用单侧检验。写法有2种:① 治疗对照差临床意义 (clinical significance) 的建立。相当于第1种场合 ① 和 ④ 的合并。写法为H:|μ|≤|Δ| , Ha:|μ|>|Δ|,Z=(|X|-|Δ|)/S* 。若H被拒绝,且|X|>|Δ|,则有利于治疗对照差具有临床意义的解释,相当于试药临床优效于或劣效于有效对照;② 临床等效性 (clinical equivalence) 试验。相当于第1种场合 ② 和 ③ 的合并。写法为H:|μ|≥|Δ| , Ha:|μ|<|Δ|,Z=(|X|-|Δ|)/S* 。若H被拒绝,且|X|<|Δ|,则有利于试药与有效对照具有临床等效性的解释。其意为试药非优效于或非劣效于有效对照。

  第 3 种场合:不预设方向,用双侧检验。写法为:H:μ=Δ, Ha:μ≠Δ,Z=(|X-Δ|)/S* 。若H被拒绝,且X≠Δ,其临床解释与上述两种场合相似,取决于X与Δ的相对大小。

  5 模拟试验

  这里以Monte Carlo方法按上述第1种场合设计模拟试验,以展示非虚假设IV期临床试验的观测功效。试验1:临床优效性试验。层数取R=3,基本设计参数取α=0.05(单侧)和β=0.1。各层总体应答比例取ξ1=0.52,ξ2=0.50和ξ3=0.48。对照差取μ=0.1,0.15,0.2,0.25 。最小可识别差量取Δ=0,0.1μi,0.2μi,0.5μi。各层应答比例为πi=ξi+μ。为不失普遍性,取非等层设计:Q1=0.5,Q2=0.3,Q3=1-Q1-Q2。由 (3.2) 得所需总样本量 N ,进而由{Qi}得各层样本量。这些取值交叉汇编形成 16 种方案。为兼容生存分析,将1年生存率看作应答比例。生存时间分布采用 Weibull:Fi(t)=1-exp(-θitγ)。由πi=exp(-θitγ)取t=1得θi=-lnπi。取γ=1/3,2/3,1,3/2,3。由此抽取病人ki,k=1,…,QiN的死亡时间是Tki=(-Qi-1ln Uki)1/γ,这里,Uki是 (0, 1) 区间伪随机数。各试验集均由同一初值开始运行。经排序为T1i< …

  6 工作实例

  这里,以建立临床非劣效性为例来说明非虚假设IV期临床试验的用法,余可类推。已知一种药物的注射剂疗效满意但用后局部疼痛,故改片剂。通过试验若能断言片剂疗效不亚于注射剂,便可取代。这由3家合作进行。已知注射剂有效率在第一医院为ξ1=0651,在第二医院为ξ2=0692,在第三医院为ξ3=0722。第一医院收治65个病人,服用片剂有效率为0.600。第二医院的这些数据依次为39、0.615,第三医院的是27、0.667。首先按虚假设作预分析,即取Δ=0,按 (3.3) 得Z=-1.46,P>0.05,不拒绝H0。按近年流行说法,认为片剂与注射剂同样有效;按本文所述,由虚假设检验的不显著结果不能建立临床等效性。

  将该试验看作预试,由其结果为设计参数赋值,设计正式试验。取α=0.05(单侧),β=0.1,ξi=0.651,0.692,0.722, μ=-0.06,Qi=0.5,0.3,0.2。根据以往临床经验,取Δ=-0.16被认为是合适的。按 (3.2) 测得所需总样本量为N=208。按给定层样本分数进行分配,比方说得到了同样有效率。再按非虚假设作正式分析,即取Δ=-0.16,按 (3.3) 计算,结果是Z=2.89,P<0.01。拒绝H,这有利于作出片剂疗效不亚于注射剂的解释。

  7 讨论

  本研究的贡献是将传统的虚假设IV期临床试验推广到非虚假设之下。 提出这种临床试验在非虚假设下所需样本量和检验统计量。其特点之一是具有还原性,即当Δ=0时还原为对应的经典方法。例如,当Δ=0时,πi*=ξi,(3.3) 还原为单样本分层数据经典比例检验:Z=∑iQipi-ξi 1 N∑iQiξi(1-ξi), Z~N(0,1)(7.1)

  但它尚未见于。其实,(7.1) 相当于把经典Cochran检验[17]由两样本比较推广到样本与总体比较。当R=1时,还原为非虚假设单样本比例检验[4]:Z=|X-Δ| N-1π*(1-π*), Z~N(0,1)(7.2)
当Δ=0且R=1时,还原为经典单样本比例检验:Z=|p-ξ| N-1ξ(1-ξ), Z~N(0,1)(7.3)

  由还原性可引申出第二个特点:它们可兼容传统的虚假设IV期临床试验。也就是它们的应用范围可覆盖非虚假设和虚假设两种场合。本研究Δ=0各试验集即针对虚假设IV期临床试验。其特点之三是观测功效与预定功效吻合,这由上述模拟试验可以看出来。特点之四是非虚假设亦可表达为虚假设。非虚假设H:μ=Δ可写成H0:μ-Δ=0即虚假设;其对立假设Ha:μ≠Δ可写成H1:μ-Δ≠0。按这种虚假设重复上述推导,亦可得虚假设临床试验。

  其用途是建立试药对于有效对照的临床优效性或非劣效性。在赫尔辛基宣言第 5 版出版后,围绕安慰剂的伦疑虑增多,有效对照受到重视。另一方面,这类临床试验所需样本量较大,常需多家医院合作进行,即多中心试验。本研究方法正是为适应这类临床试验的需要而提出的。随着改革开放进程,中医中药走出国门,迄今关于中药的临床试验多采用化学药物作对照。成功的中药通常以"疗效不亚于化学药物,且无毒副作用"的姿态出现。其证据只能出自非虚假设临床试验,虚假设试验对此无能为力。中药临床试验不易实行随机双盲,若采用样本与总体比较方式,本研究方法恰好适用。

  本研究提出的非虚假设IV期临床试验基于质反应测量值,至于量反应测量值,则有待进一步研究。

  文献

  1  Dunnett CW,Gent M. Significance testing to establish equivalence between treatments,with special reference to data in the form of 2 X 2 tables. Biometrics,1977,33 (4): 593~602.

  2 Holmgren EB. Establishing equivalence by showing that a specified percentage of the effect of the active control over placebo is maintained. Journal of Biopharmaceutical Statistics, 2001, 9(4): 651~659.

  3 Rothmann M, Chen G, Li N, Chi GYH. Design and analysis of noninferiority mortality trials in oncology. DIA 37th Annal Meeting, July 8~12, 2001, Denver, Colorado.

  4 赵国龙非虚假设比例检验及其在临床试验中的应用统计学报, 2003, 41(1):21~37.

  5 赵国龙, 杜诗军. 非虚假设综合卡方检验. 应用概率统计, 2003, 19(4):408~414.

  6 赵国龙, 陈洪涛. 非虚假设非中心法及其临床应用. 中国卫生统计, 2004, 21(4):215~218.

  7  赵国龙, 孙爱民, 陈洪涛等. 非虚假设临床试验引论. 河南医学研究, 2005, 14(1): 22~27.

  8 Fleming TR. Treatment evaluation in active control studies. Cancer Treatment Reports, 1987, 71(11): 1061~1065.

  9 Fleming TR. Evaluation of active control trials in AIDS. Journal of Acquired Immune Deficiency Syndrome, 1990, 2: 82~87.

  10 Temple R. Difficulties in evaluating positive control trials. Proceedings of the Biopharmaceutical Section of the American Statistical Association, 1983, 1~7.

  11 Blackwelder WC. Proving the null hypothesis in clinical trials. Controlled clinical trials,1982,3:345~353.
  
  12 Huque M, Dubey S, Fredd S. Establishing therapeutic equivalence with clinical endpoints. Proceedings of the Biopharmaceutical Section, 1989, 46~52.

  13 Fleming TR. Design and interpretation of equivalence trials. American Heart Journal,2000, 139: 171~176.

  14 Hauck WW, Anderson S. Some issues in the design and analysis of equivalence trials. Drug Information Journal, 1999, 33: 109~118.

  15 Siegel JP. Equivalence and non-inferiority trials. American Heart Journal,2000, 139: 166~170.

  16Temple R. Problems in interpreting active control equivalence trials. Accountability in Research, 1996, 4: 267~275.

  17 Cochran WG. Some methods of strengthening the common X2 tests. Biometrics, 1954, 10: 417~451