因子分析法在不同地区恶性肿瘤死亡率分析中的应用

来源:岁月联盟 作者:罗盛 陈景武 马峻岭 时间:2010-07-12

【摘要】    目的:利用因子分析的方法,研究各种恶性肿瘤死亡率间内在联系及地区分布特点,探讨山东省某县不同恶性肿瘤死亡率间的共同影响因素。方法:对某县2000~2002年3年的全死因回顾调查资料中不同地区各恶性肿瘤标化死亡率进行因子分析。用主成分法提取因子进行方差最大正交旋转,因子负荷及主因子得分。结果:经方差最大正交旋转后的4个主因子特征根分别为2.518、1.942、1.528、1.465,累计贡献率为74.54%。其中在第1公因子上载荷较大的有胃癌、白血病、乳腺癌、鼻咽癌,该因子在该县北部地区F、G、H、P等4个乡镇得分较高;在第2公因子上载荷较大的有食管癌、结肠癌,该因子在该县东北地区E、H等2个乡镇得分较高;在第3公因子上载荷较大的是肺癌和膀胱癌,该因子在该县西部地区D、N、Q等3个乡镇得分较高;在第4公因子上载荷较大的有肝癌和宫颈癌,该因子在该县中部地区B、G、K等3个乡镇得分较高。结论:不同肿瘤死亡率可能存在共同的支配因子,可从各因子得分较高的地区入手,进行流行病学调查,以发现具体影响因素,采取相应的防治措施以降低肿瘤死亡率。

【关键词】  因子分析; 恶性肿瘤死亡率; 地区分布

  因子分析(factor analysis)是寻找潜在支配因子的模型分析方法。支配因子可分为共性因子和特殊因子。共性因子是指同时影响多个变量的潜在影响因子;特殊因子是指只影响某个变量的潜在影响因子,也即某个变量除共性因子以外的变异来源[1]。在对不同部位恶性肿瘤死亡率地理分布的观察中,我们发现有些肿瘤死亡率是相关联的[2,3],它们之间是否存在潜在的共同支配因子?哪些地区存在相同的支配因子?本研究利用原有的资料, 用因子分析方法探讨各种恶性肿瘤死亡率间的内在联系及地区分布特点,探讨山东省某县不同恶性肿瘤死亡率间的共同影响因素,为进一步做流行病学调查及制定相应的防癌规划提供理论依据。

  1  资料来源与方法

  1.1  资料来源
   
  山东省某县2000~2002年不同地区全死因回顾调查中各恶性肿瘤的标化死亡率。该调查是由某大学临床肿瘤学院与该县卫生局在2000年合作开展的。调查质控指标达到设计要求,资料数据可靠。

  1.2  分析方法
   
  先求出10种恶性肿瘤死亡率的相关系数矩阵, 用主成分法求得特征根λi , 按λi > 1的原则选取公因子, 然后进行方差最大正交旋转, 得到旋转后的特征根及因子负荷, 并计算各样品点的因子得分。全部计算使用spss13.0统计软件。

  2  结果

  2.1相关系数矩阵
   
  10种恶性肿瘤标化死亡率的相关系数矩阵表明,除了少数几种恶性肿瘤标化死亡率如肝癌与膀胱癌,结肠癌与乳腺癌、肝癌与结肠癌等在地区分布上无明显相关以外,大多数恶性肿瘤死亡率之间有中度及以上相关性,见表1。

  表1  10种恶性肿瘤相关系数矩阵(略)

  2.2主成分法确定因子载荷
   
  用主成分分析法进行初始因子分析,按照按λi > 1的原则选取公因子,决定公因子数为4,求出初始的特征根和贡献率。经方差最大正交旋转,得到旋转后的特征根和贡献率。从表2可知,4个公因子方差累计贡献率为74.54%,即4个公因子可以利用10种恶性肿瘤死亡率全部信息的74.54%。

  表2  旋转前后的特征根及累计贡献率(略)

  2.3旋转后的因子负荷及共同度
   
  经方差最大正交旋转后,4个公因子的因子载荷和共同度见表3。其中胃癌在公因子1和公因子2上均表现出关联。胃癌、白血病、乳腺癌、鼻咽癌在第1公因子有较大载荷;食管癌、结肠癌在第2公因子有较大载荷;肺癌和膀胱癌第3公因子有较大载荷;肝癌和宫颈癌的第4公因子有较大载荷。从表3可见,胃癌、白血病、膀胱癌、乳腺癌、结肠癌死亡率被4个公因子解释的比例均在77%以上;10种恶性肿瘤中,被解释的比例最小也在62%以上。说明4个公因子可解释10种恶性肿瘤死亡率的主要信息。

  表3  旋转后的因子载荷及共同度(略)

  2.4不同地区恶性肿瘤死亡率的主要公因子得分
   
  表4中,地区以乡镇为单位,用字母表示。

  表4  不同地区恶性肿瘤死亡率的主要公因子得分(略)

  3   结果
   
  本研究主要分析山东省某县不同恶性肿瘤死亡率的共同影响因素,结果表明,该县居民恶性肿瘤的发病和死亡具有明显的地区分布,在地区分布中,各种恶性肿瘤的死亡具有一定程度的聚集性。经主成分法因子分析,4个主因子可以解释10种恶性肿瘤死亡率的74.54%;10种恶性肿瘤中,被解释的比例最小也在62%以上;而胃癌、白血病、膀胱癌、乳腺癌、结肠癌死亡率被解释的比例均在77%以上,提示这10种恶性肿瘤之间存在中等偏强的内在联系和地区分布特点。因此,能进一步通过流行病学病因研究,查找出可能存在的相关因素,对于有效地控制全县恶性肿瘤死亡率将会起到决定性的作用。
   
  公因子1因子分析结果显示,第1公因子主要影响胃癌、白血病、乳腺癌、鼻咽癌,且胃癌、白血病、乳腺癌在该因子上的载荷为正而鼻咽癌的载荷为负,提示该4种恶性肿瘤的发病是受某共性因素的支配,且该因素对胃癌、白血病、乳腺癌有促进作用而对鼻咽癌起抑制作用。在第1公因子上得分较高的地区有F、G、H、P;这4个乡镇主要位于该县的北部地区。
   
  公因子2因子分析结果显示,第2公因子主要影响食管癌、结肠癌,且在该因子上的载荷均为正,提示该两种恶性肿瘤的发病是受某共性因素的支配,且该因素越明显,该两种恶性肿瘤的死亡率越高。在第2公因子上得分较高的地区有E、H,这2个乡镇主要位于该县的东北部地区。
   
  公因子3因子分析结果显示,第面公因子主要影响肺癌和膀胱癌,且在该因子上的载荷均为正,提示该两种恶性肿瘤的发病是受某共性因素的支配,且该因素越明显,该两种恶性肿瘤的死亡率越高。在第3公因子上得分较高的地区有D、N、Q,这3个乡镇位于该县西北地区。
   
  公因子4因子分析结果显示,第4公因子主要影响肝癌和宫颈癌,且在该因子上的载荷均为正,提示该两种恶性肿瘤的发病是受某共性因素的支配,且该因素越明显,该两种恶性肿瘤的死亡率越高。在第4公因子上得分较高的地区有B、G、K,这3个乡镇位于该县中部地区。
   
  由于恶性肿瘤的发生是很多因素共同作用的结果,其病因至今未明。本研究的因子分析结果显示,该县恶性肿瘤死亡率之间存在一定的内在联系,并具有地区分布特点,这就可以根据各地区的共性和特性结合肿瘤的流行病学特征来探讨肿瘤死亡率的影响因素,为深入开展恶性肿瘤的病因研究提供线索。

【】
     1 韩兢,王洁贞,李会庆,等.山东省不同地区恶性肿瘤死亡率的因子分析.山东大学学报(医药版),2002,40(4):356~358.

  2 饶克勤,陈育德,李连弟.前10位恶性肿瘤死亡率的聚集性及其地区分布和相关因素的分析.中国卫生统汁,1993,10(4):4~7.

  3 周天枢,郑弘,吕华东,等.因子分析在恶性肿瘤死亡率相关分析中的应用.数理医药学杂志,2000,13(4):363~364.