论解决变量敏感问题调查的分拆模型
来源:岁月联盟
时间:2010-06-25
关键词:变量敏感问题;随机化回答模型;分拆模型? ?
1 引言?
所谓敏感性问题是指所调查的内容涉及私人机密,受访者不愿或不便于向外界透露的问题,如考生作弊,个人或单位偷漏税及其数额,个人的不良嗜好或行为等问题都属于敏感性问题。根据问题类型的不同,可划分为两类:变量敏感性问题与属性敏感性问题。变量敏感性问题是针对数量敏感标志提问,如“贵公司去年偷漏税总额为多少万元”,目的在于推断总体的数量特征;属性敏感性问题则是针对品质敏感标志提问,如“您在上学期的期末考试中是否作弊?”,目的在于推断具有敏感特征的单位数占总体单位数的比例。由于敏感性问题具有隐秘性的特征,如果采用直接的提问方式则难以获得真实准确的数据资料,因此众多学者提出很多处理方法,其中最普遍的做法是构造随机化回答模型。?
2 分拆模型的设计思路与适用条件?
随机化回答模型有着对应的优缺点,基于其难以大规模推广应用的缺陷,处理变量敏感性问题可以突破上述一贯做法,因为在许多市场调查的实践中主要以公司产品性能、服务状况、客户意见、市场占有率、市场拓展潜力等调查为主要目的,而变量敏感性问题在其中一般起着提供辅助资料的作用,以至于对总体数量特征的估计精度要求并不高。既然如此,我们就可以采用一些变通的处理方法。?
分拆模型的设计宗旨即为实用、有效、简单。它通过细分的方法,将变量敏感性问题运用各种方法拆分为非敏感问题或敏感度较低的问题,以消除被调查者的心理顾虑。按照分拆方法的不同,可以分为区间分拆模型、时间分拆模型与分拆模型。?
需要说明的是,分拆模型并不是解决所有变量敏感性问题的万用良方,其适用条件仅为对总体数量特征进行粗略估计的场合。那些需要对总体数量特征进行精确推断的场合仍需应用相应的随机化回答模型,因此分拆模型与随机化回答模型各有所长、相互补充。?
3 分拆模型的应用?
(1)区间分拆模型。?
区间分拆模型的设计思路为变开放式敏感问题为封闭式问题。所谓开放式问题是指所提出的问答题并不列出所有可能的答案,而是由被调查者自由作答;封闭式问题是指已事先设计了各种可能的答案,被调查者只要或只能从中选定一个或几个现成答案。?
如对于“收入”这个敏感性变量的提问,如直接提问“2006年,您的家庭总收入为元?”,对于这个开放式敏感问题被调查者可能不愿真实回答或无法精确回答。在这种情况下,可以考虑将其拆分为区间,改为封闭式问题。如改为:?
2006年,您的家庭总收入为元??
A. 10000元以下 B. 10000~30000元?
C. 30000~50000元D. 50000元以上?
经过拆分为区间,被调查者只需选择对应的答案即可,无需直接作答暴露具体的实际财富,这样就在一定程度上降低了问题的敏感度,提高了被调查者的合作热情。?
但是需要注意的是,封闭式问题的备选区间不能随意乱划,而要根据研究目的及数据分析需要进行相应的划分。
(2)时间分拆模型。?
时间分拆模型的设计思路为缩短时期长短,即对于一些时期敏感性数据的提问,根据时期数据可以相累加的特点,将对于较长时期数据的提问缩短为较短时期,以降低敏感度。 如对于年收入的提问“2006年,您的年收入为元?”,如果直接提问,一些被调查者尤其高收入者可能不愿真实回答。运用时间分拆模型,将提问的时期界限缩短,改为“2006年,您的平均月收入为元?”或“2006年,您平均一周收入为元?”?
在上例中,由一年的时期界限缩短为一月或一周,这样可以消除被调查者不愿露富的防备心理。但是需要注意的是,采用时间分拆模型不能将时期界限无限制地细分,如将时期为一年的数据缩短为一分钟、一秒钟甚至更短。过细的划分会增加被调查者的负担,甚至引其反感。?
(3)运算分拆模型。?
运算分拆模型的设计思路为将一个变量敏感性问题分拆为几个非敏感性问题,通过对非敏感问题数据之间的相互运算得出敏感问题的答案。?
如对于体重的提问,“您的体重为公斤?”如直接发问,被调查者尤其是肥胖或过瘦人士可能不愿真实回答,那么可以将其分拆为几个非敏感问题,如:?
① “您对您的体重满意吗?”?
A. 满意(回答A请回答第②题)?
B. 不满意(回答B请回答第③~⑥题)?
② “您的体重为公斤?”?
③ “您认为自己的体重偏?”A胖 B 瘦?
④ “您认为自己的理想体重应为公斤?”?
⑤ “您认为有效的减(增)肥产品一周至少应减去(增加)公斤?”?
⑥ “您认为有效减(增)肥产品的疗程最多为周?” ?
在该例中,第①题为过滤性问题,根据“体重”这个变量敏感特征的情况,以“对自己的体重是否满意”为分类标志将被调查者分为敏感人群与非敏感人群。如对自己体重满意的应为非敏感人群,可以对“体重”这个变量特征直接作答;而对自己体重不满意的则为敏感人群。?
针对敏感人群采用运算分拆模型设计了③~⑥题四道非敏感性问题,首先通过第③题,将肥胖敏感人群与过瘦敏感人群区别开来,④~⑥则是计算敏感变量特征的数值依据,若为肥胖敏感人群,则根据运算公式“理想体重+每周减肥的公斤数×减肥周数≈现有体重”近似计算出该被调查者的体重数据;若为过瘦敏感人群,则根据计算公式“理想体重-每周增肥的公斤数×增肥周数≈现有体重”近似计算出该被调查者的体重数据。?
采用运算分拆模型需要注意的有:?
(1)要注意隐藏对变量敏感问题的调查意图。如在上例中,如果按照上面①~⑥题的排列顺序,且采用由被调查者自行填写答案的自填式问卷形式,那么敏感人士可能通过第②题(虽然他不需作答)已察觉出该问卷的调查企图——对体重数据的询问,而不愿接受之后的调查。所以设计者应注意选择问卷形式,最好采用由调查员发问且代替被调查者填写的访问式问卷代替自填式问卷。如果需要设计自填式问卷,则必须注意版面的适当安排,应将问题②与③~⑥适当分隔或相应调整问题的排列顺序。?
(2)要注意拆分为非敏感问题的数量不宜过多。分拆之后问题的数量如果过多,相应包含的变量特征也越复杂,这就势必影响计算公式的定义及计算结果的准确性。?
?
[1]?李金昌. 应用抽样技术[M]. 北京:出版社,2006:207.?
[2]?张永青,陆伟,叶冬青. 数量特征敏感问题调查技术[J]. 疾病控制杂志,2003,(7):542-544.?
[3]?柯惠新,丁立宏. 市场调查与分析[M]. 北京:统计出版社,2000:142-143.
下一篇:对公平与效率的再思考