来源:《社会学研究》2007年第6期 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
近来有学者撰文《高回收率更好吗?》(以下简称“高文”)对中国目前社会调查中的高回收率提出了质疑,指出由于严格执行随机抽样和实地调查所必然面临的许多客观障碍和所必然造成的回收率下降,所以,过高的回收率实际上意味着调查过程的不严格性,其结果则是调查资料的低质量(风笑天,2007)。那么中国目前社会调查研究现状果真如此吗?本文将针对以上批评意见,在澄清“样本规模”、“调查回收率”、“应答率”等概念含义的基础上,结合“2003年全国综合社会调查(城镇部分)”(简称CGSS2003)和其他几项国内较大规模社会调查的实际情况,对中国目前社会调查中的“高回收率”做出另一种解读。 一、样本规模的含义及误读 在“调查研究的分析中,如果要运用到推论统计时,我们会假定所应答率的意义及其他有样本都应该填完问卷并寄回。既然这几乎是不可能的,偏误就成为我们必须要注意的问题了”。“比起低回收率,较高的问卷回收率,偏误也较小”(巴比,2005/2004:253)。由此看来,在调查研究中,调查回收率的高低会影响到样本对总体的偏误,即样本的代表性。那么什么是调查回收率呢?对于从事调查的研究人员而言,这似乎是一个过于简单的问题。“社会调查中的回收率(responserates,也称作回答率或应答率)指的是‘调查者实际调查的样本数与计划调查的样本数之比’,也就是社会调查过程中研究者成功完成调查询问的个案数占计划完成的样本总个案数的百分比”(风笑天,2007)。面对如此清晰明了的答案,我们似乎不应再对调查回收率的含义持有什么疑义了。 但是以下事实动摇了我对以上定义的信心。在“高文”中,作者指出CGSS2003的有效回收率为99.9%。读到这一数字后,笔者查阅了“高文”作者引述的5篇使用CGSS2003数据的相关研究论文,发现这些作者给出了有关CGSS2003数据的两个数字,一是按抽样方案抽取了5900位城镇居民,另一是实际完成样本5894个,并没有给出有关调查回收率的确切数字。99.9%的调查回收率是“高文”作者根据以上调查回收率的定义,利用这两个数字计算出来的。问题是根据这一定义计算出来的这一数字真的是CGSS2003的调查回收率吗? 为了求得确证,笔者查阅了相关调查研究教材中有关调查回收率的定义:④“应答率是评估收集的资料有效性的基本参数,即接受访谈(或应答者)的人数除以样本的人数(或单元数)。分母包括了从总体中抽取的所有人,即包括那些虽被抽中但因拒绝、语言问题、疾病或者缺乏易得性而没有应答的人”(福勒,2004/2003:41)。比较以上有关调查回收率的两个定义,发现其间调查回收率的分母存在一些差异。前者是“计划调查的样本数”,后者是“从总体中抽取的所有人,包括那些虽被抽中但因拒绝、语言问题、疾病或者缺乏易得性而没有应答的人"。由于前一个定义没有对“计划调查的样本数”给出进一步的说明,不知道计划中是否也包括了“没有应答的人”,但通过作者计算出的99.9%调查回收率,似乎是没有包括,因为一项涵盖了近6000人的全国抽样调查,几乎不可能只有6名“没有应答的人”。不难看出,“高文”作者在计算调查回收率时,对5900这个数字的确切含义发生了误读。那么5900这个数字的确切含义又是什么呢? 从调查执行的发生流程看,无论是邮寄问卷,还是当面或电话访谈调查(下面只在必要时区分二者),都要先制定抽样方案。而在制定抽样方案时,首先要确定样本规模,即确定调查样本中所包含的被调查者数量。由于在调查执行中无法百分之百地调查到所有预先选定的被调查者,因此,根据是否计人调查中的无应答数量,样本规模可以有两种取值方式。如果不计人无应答数量,那么样本规模只是依据研究需要和经费预算确定的一个理论值。而在调查执行中,对于那些无应答的被调查者,需要使用备选的替换样本来补足,这样实际调查的被调查者数量就要大于样本规模的理论值。如果制定抽样方案时,事先计入了无应答数量,就要设定一个大于研究需要的被调查者数量的样本规模。在调查执行中,那些由于无应答而减少的被调查者数量,就会使成功完成调查的人数接近研 究需要的被调查者数量。 明确了样本规模的含义后,就可以进一步澄清调查回收率的含义。无论是邮寄问卷,还是访谈调查,调查回收率都应该是成功完成调查的被调查者数量与实际调查的被调查者数量的比值。在邮寄问卷调查中,由于存在被调查者不回邮问卷的现象,实际寄出的问卷数量通常大于研究需要的被调查者数量,即不计入无应答数量的样本规模。而被调查者实际回邮问卷数量与实际寄出的问卷数量之比,即问卷回收比例就是邮寄问卷调查中的调查回收率。 与邮寄问卷调查的回收率相比,访谈调查的回收率计算稍复杂些。在访谈调查的抽样中,如果确定样本规模时不计人无应答数量,那么抽样时就要抽取多于样本规模的被调查者地址,其中二部分是备选的替换样本。在访谈调查中,调查员会按被抽中的被调查者地址对其进行访谈,而访谈数量则取决于样本规模,如果成功访谈数量达到了样本规模,调查就结束了,否则就需要继续访谈。而在计入无应答数量的情况下,除了要抽取较多的被调查者地址外,同时也要逐一按这些地址进行访谈。这时成功访谈数量既可能多于、也可能少于研究需要的被调查者数量。相比之下,确定样本规模时不计入无应答数量更容易控制实际完成的被调查者数量。由此可见,访谈调查中,成功完成访谈数量与实际访谈数量之比,即访谈成功比例就是访谈调查中的调查回收率。 根据以上分析,可以认定使用CGSS2003数据的研究论文给出的5900份,应该是没有计人无应答数量的样本规模,因此,CGSS2003的回收率不应该据此被计算成99.9%。相关资料显示,在CGSS2003中,因为各种原因访谈未成功的比例大约是30%(边燕杰、李路路、蔡禾,2006:108)。据此推算CGSS2003中实际发生的访谈数量大约在8430份左右,调查回收率大约是70%左右,而不是“高文”作者计算的99.9%。 二、国内调查回收率评估 如上所述,在计算调查回收率时,没有计入无应答数量的样本规模是不能作为分母使用的。也就是说,在“高文"的调查回收率定义中,如果针对的是邮寄问卷调查,则“计划调查的样本数”应该是按实际抽取的被调查者地址寄出的问卷数量;而换作访谈调查时,“计划调查的样本数”应该是调查中实际发生的访谈数量。由于“高文”在计算国内调查回收率时,没有对样本规模的含义进行区分,因此计算不当的可能性是存在的。为了进一步澄清国内调查回收率现状,笔者逐一核查了“高文”在计算国内调查回收率时,收集到的27篇刊发在《社会学研究》2004年第2期至2006年第3期上的研究论文。在这些论文中有10篇采用的是非概率抽样。由于非概率抽样无法预先估计抽样误差,也无法根据调查回收率评估样本对总体的偏误,因此这里不再分析这些非概率抽样案例。另17篇采用概率抽样的论文共涉及10个调查项目,故此,以调查项目为单位对调查回收率做具体分析。 对这10项调查的核查结果显示,它们均为访谈调查,其中有5项是全国范围的抽样调查,另5项则是省市范围的抽样调查。利用这些调查数据撰写的研究论文均给出了样本规模和完成的问卷数量,但只有“北京市社会网络与健康调查”、“性社会学全国抽样调查”和“当代中国社会变迁、社会意识与社会流动调查”等3项调查给出了与实际发生的访谈数量有关的数据,加上前面提及的CGSS2003的回收率资料,共有4项调查可以计算出调查回收率。为了获取其他诸项调查实际发生的访谈数量,笔者电话咨询了各项调查执行过程的主持人。结果除一位调查主持人在国外未取得联系外,其他几位调查主持人均报告,各项调查在执行过程中均发生过样本替换,但没有保留样本替换的相关资料,因此无法提供准确的实际发生的访谈数量。表1给出了这些概率抽样调查的相关信息。 表l显示在4项具有回收率资料的调查中,有3项为全国调查,调查回收率分别为84.2%,76.3%和70%。从这组数据不难看出,国内近年一些全国范围的调查回收率大约在70—85%之间。而在“高文”提及的美国GSS调查中,回收率最低值为70%,最高值为82%,(风笑天,2007)。相比发现,中美全国范围(截面式)调查的回收率并无太大差别。需要进一步说明的是全国范围的调查回收率只是一个平均值,相比之下,农村调查的回收率要高于这一数值,而城市特别是大城市调查的回收率则低于这一数值。这一看法得到2000年北京市社会网络与健康调查回收率为59.9%这一事实的支持。无独有偶,在CGSS2003中,上海市的调查回收率为53%,也远低于70%的全国平均值(边燕杰、李路路、蔡禾,2006:108)。另外,从“高文”提供的一组国外调查回收率数据看,美国、英国和日本在1998—2000年间,调查回收率基本维持在60一70%之间(风笑天,2007)。再有,相关资料显示,华人社会所进行的社会调查应答率较低。1997年香港中文大学香港亚太研究所进行的社会指标调查的应答率为50%左右,而台湾1990年代进行的社会变迁基本调查的应答率亦鲜有超过45%的(陈应强,2001:91—102)。希望这些数据能为学术性调查的回收率提供一个参考标准。 另外,需要补充说明的是,在前面提及的研究论文中,只有少数研究者报告了调查回收率,而且一些调查研究主持人也没有保留样本替换的相关资料。这一事实表明,在目前国内调查研究中,一些研究者并没有将调查回收率作为反映调查质量的主要技术指标来对待。这些研究者在报告了样本规模和完成的问卷数量后,往往会报告实际完成的调查样本与调查总体在一些基本人口学参数上的比较结果。也就是说,当前国内调查研究的质量评估,主要采用的是效标效度方法,即选择人口普查资料中的几个人口学指标:性别、年龄、教育、婚姻等作为效标,将样本资料与人口普查资料加以比较,如果样本资料的数据结构接近普查资料的数据结构则认为该样本资料是有效的,质量是有保证的;反之则认为样本资料效度较低,质量不高。应该说这种质量评估方法本身是没有问题的;但缺少了对调查回收率的评估,可能会使调查质量的评估产生偏误。 表l
*调查主持人出国,无法与之取得联系。 **调查主持人报告,调查执行中有样本替换发生,但没有保留相关数据资料。其中“转型时期中国大陆城市居民的阶层意识调查”的主持人补充报告,此次调查的回收率保守不低于66.6%。 三、调查应答率及相关偏误 以上对国内调查回收率的分析表明,所谓国内调查回收率过高的看法,只是对样本规模含义误读的结果。既然如此,针对国内调查回收率过高而导致调查过程的不严格性和调查资料的低质量的看法,明显缺乏事实依据。不过,即使目前国内调查不存在回收率过高现象,但一些研究者没有将调查回收率作为质量评估指标的做法,也使得对调查回收率进行深入讨论显得十分必要。从目前国内调查实践看,对于调查回收率仍存在着一些模糊认识,其中既有对调查回收率含义的不准确理解,也有对改善调查回收率方法的错误认识。在上面评估国内调查回收率时,为了更清晰、简洁地说明问题,并没有十分深入地探讨调查回收率的详细内涵。其实,在具体的调查执行中,调查回收率的计算是较复杂的。表2是一项当面访谈调查执行过程中,要求调查员现场填写的《访谈不成功情况记录表》。 通过分析《访谈不成功情况记录表》的内容,发现根据抽样地址是否是居民住户,以及抽样地址状态是否明确,可以将这些不成功类型划分成三种:1号是抽样地址为“非住户”;2、3、4号是抽样地址为“住户状况未知”;5、6、7、8号是抽样地址为“住户”。其中“住户”不成功情况,又可进一步分为拒访、无法联系和问题户(语言、听力、疾病等问题)等三种。从调查执行的过程看,“非住户”导致的访谈不成功是抽样环节出现的偏误;而“住户状况未知”、“拒访”、“无法联系”和“问题户”导致的不成功,则是实地访谈环节出现的偏误。于此可以看到,与邮寄问卷式调查不同,访谈调查是可以区分住户与非住户的,其中“非住户”所造成的偏误是在抽样环节中出现的,理应记人抽样误差的计算之中。由于调查回收率这个概念并没有对抽样和实地访谈两个环节加以严格区分,因此在分析调查偏误时存在着某些不清晰之处。从目前一些调查研究文献看,通常也将“responserates"译为应答率,将“non-response"译为“无应答”。这里的“应答”关注的是调查员与被调查者的应答过程,是以确有被调查者存在为前提的。如果抽样过程中,抽到的是非居民户、空户,就不存在“应答”之人,自然也就不应再记人应答率计算之中,所以应答率就是特指实地访谈环节中的访谈成功比率。也就是说,使用“应答率”来代替“调查回收率”能够对实地访谈中各种因素对访谈成功的影响程度做出更准确的评估。 表2访谈不成功情况记录表
在概念层次上,所谓应答率是合格的已经做完调查的样本单位的百分比(扎如、布莱尔,2007/2005:166)。①而从操作层次看,应答率则是已经完成的合格调查样本单位数(简记为“访谈数”)除以住户数。由于调查执行中存在着“住户状况未知”的情况,因此,应答率实际上存在着一个值域区间(扎如、布莱尔,2007/2005:216)。应答率值域区间的上、下限计算公式分别为:应答率区间上限=访谈数/住户数下限=访谈数/(访谈+拒访+无联系+问题户)(公式1)应答率区间下限=访谈数/住户数上限=访谈数/(住户数下限+住户状况未知中的住户数)=访谈数/(住户数下限+住户状况未知数×住户比例)=访谈数/{住户数下限+住户状况未知数×[住户数下限/(住户数下限+非住户)]}(公式2) 基于同样的考虑,如果将公式1、2中的访谈数换成拒访数、无联系数或问题户数,就可以相应地获得拒访率、无联系率、问题户率值域区间的上、下限。除了应答率,在调查执行中,合作率也是需要报告的质量评估指标,它是接受调查的样本单位数与接受调查样本单位数和拒绝调查的样本单位数之和的百分比,表示调查在那些实际已经联系上,且户内有合格的被调查人的户中完成的好坏(扎如、布莱尔,2007/2005:166、216)。在操作层次上,它与应答率区间上限值的区别在于分母不包括问题户。合作率的计算公式为:合作率=访谈数/符合调查要求的住户数=访谈数/(访谈+拒访+无联系)(公式3) 在澄清应答率含义的基础上,我们进一步探讨应答率的变化对调查质量的影响。撇开上面“住户状况未知"的情况不谈,应答率的变化主要与无应答者数量的多少有关。下面是一个无应答引起潜在误差的例子:假设某样本有100位被调查者,当应答率为90%时,意味着有90位被调查者对调查做出了应答,有l0位无应答者。如果这90位应答者中各有50%的人对某一问题做出了“是(45名)”与“否(45名)"的回答,则10位无应答者回答“是”(或“否”)的可能性是010%。这时如果假设被调查者全都应答,则回答“是”的实际比例最多不超过55%,最少不低于45%。也就是说,由于无应答的存在,对被调查者回答的估计存在着潜在偏误。表3给出了在不同应答率水平下,假设应答者中有50%的人做出了某一项回答和样本中每一个人都做了应答,其真值的取值范围(福勒,2004/2003:45—46)。 上述例子进一步明确了无应答产生偏误,以及较多的无应答会产生较大的偏误的事实。其实,在调查执行中,为了满足样本规模的要求,较高的拒访率会使得调查员使用备选的替换样本。而在概率抽样调查中,如果过多地替换样本,就有可能使被调查者失去其随机性特征,因为这些被调查者中大多是那些愿意接受采访的人,找到他们更可 表3无应答引起的潜在误差范围的估计
能是一种“偶遇”,而非“随机",这大大增加了出现系统偏误的可能性。这时,即使样本的人口学特征与普查数据的特征完全一致,充其量这种调查也只是非概率抽样中的配额抽样调查。当然,在一些特殊情况下。低应答率的概率抽样或配额抽样也是一种不得已而为之的例如,高收人人群一直是调查执行的难点,要想以较高应答率调查到满足样本结构要求的样本几乎是不可能的。一位研究者在介绍他在香港地区调查高收入人群的经验时谈到,调查中的一个问题是高收入住户拒访率很高,致使收入指标无法满足样本结构的要求,以及导致系统误差。问题的解决有赖于香港居住区域与收人既有的相关关系,即反复增加香港高收入区(半岛区、浅水湾)的样本,最后就把我们的样本收人结构平衡到与香港人口普查的数据结构一样。但香港能够这样做,是由于它有一个比较准确的人口普查资料基础,你可以花一定费用从政府有关部门买到。有了这样的资料基础,研究者就可以及时纠正调查样本存在的系统误差。当然这也是一种权宜之计,否则高收率人群的缺失可能会使研究结论产生更大的偏误(边燕杰等,2002)。 总之,无应答或低应答率存在着产生偏误的较大可能性;但是,据此我们并不能确切地获悉无应答对资料的影响程度,因为我们通常缺乏关于无应答何时可能或不可能产生关于调查内容偏误的准确资料。有研究表明,一个具有相对低应答率的调查结果与一个有较高应答率的调查结果非常相似。也就是说,由于缺少无应答如何影响调查内容的准确资料,最大限度地提高应答率的意义主要体现在提升调查资料的信度上;否则当应答率较低时,很有可能会招致批评者对调查资料信度的质疑(福勒,2004/2003:57)。 责任编辑:张磊 |
郝大海:应答率的意义及其他(一)
更多阅读
需要那种可以自动换IP刷网页点击率的,来一起分享下吧! 不同ip刷点击率
现在上网的朋友都知道点击率这个词吧,都想法设法提高各种点击率的,什么广告点击率,视频点击率,小说点击率等等。这里给大家指导下,如何通过“阿冲全能点击王”这款软件来实现刷点击率的功能,当做一款刷点击软件、刷点击率软件、自动换IP刷
转载 普希金的夫人及其后代 普希金的天使
原文地址:普希金的夫人及其后代作者:雄逸普希金的夫人及其后代一、夫人:娜塔丽娅·尼古拉耶夫娜·冈察洛娃俄国美人娜塔丽娅·尼古拉耶夫娜·冈察洛娃娜塔丽娅·尼古拉耶夫娜·冈察洛娃是俄国著名诗人普希金的妻子。良好的教育,社
汽车尾翼的原理及其种类和意义 汽车加装尾翼违法吗
摘要:本文从尾翼的物理学原理入手,分析了汽车尾翼的基本原理以及当今汽车尾翼的种类及其意义。关键词:尾翼;伯努力方程;空气动力学 随着经济的发展,中国的公路上有了越来越多的各式汽车,细心的人们会发现很多汽车的尾部都装有一个动感十
杨千嬅和林夕最好的词及其他 林夕杨千嬅为什么反目
一直很庆幸香港有个人叫林夕,更庆幸他很红,虽然因此他赚了很多钱,虽然他写词是为了赚钱,虽然他不至于伟大到为全世界的华人写词,但这一切都不妨碍我对他的感激。如果没有这个人,这个世界会有多么的闷,这个世界的男男女女又有什么可唱?当然,在
高罗佩《狄公案》的中文译本及其他 狄公案 高罗佩 在线
荷兰汉学家高罗佩的巨著《狄公案》系列小说由16部中长篇和8部短篇组成。该书取材于中国古典公案小说《狄公案全传》(又名《武则天四大奇案》)及其他古典公案小说及刑狱作品,兼采西方推理侦探小说之长,问世以来,在欧美广受赞誉,重版不绝。