网络问卷调查的数据质量控制研究
余富强,胡鹏辉,杜沙沙
(南京大学社会学院,江苏南京210023)
摘 要:为了提高网络问卷调查的科学性,文章探讨在网络问卷调查的不同阶段,控制网络问卷调查数据质量的方法。在问卷设计阶段,研究者需要优化网络问卷以适应移动智能终端,并充分利用网络问卷系统的样本监测、自动跳转和数据检测等技术优势;在抽样阶段,针对网络问卷多用于非概率抽样研究这一事实,研究者可采用被访者驱动等可实现统计推论的方法,提升抽样的科学性;在数据收集阶段,研究者需要增强对于社交平台用户邀请方式和电子红包等激励方式的控制,实现对于网络问卷扩散及填答方式的掌控;在资料处理阶段,研究者需要根据网络问卷的内部和外部特征进行在线即时审核,并利用特定统计技术实现数据清洗。
关键词: 网络问卷;数据质量;被访者驱动抽样;在线即时审核
中图分类号:C03 文献标志码: A
A Study on the Data Quality Controling of Network Questionnaire Survey
YU Fu-qiang Hu Peng-hui[Corresponding Author] Du Sha-sha
(School of Social and Behavioral Sciences, Nanjing University, Nanjing,Jiangsu,China,210023)
Abstract: In order to improve network questionnaire research’s scientificity, this paper explores the way to control the quality of network questionnaire research in every stage. At the stage of questionnaire design, researchers should optimize questionnaire to adapt the intelligent terminal, and fully use the technological advantages of network questionnaire system, including sample monitoring, automatic skip and data detection. At the sampling stage, according to the reality that network questionnaires more take non-probabilistic sampling, researchers could take some non-probabilistic sampling methods, such as Respondent-Driven Sampling, which can conduct statistical inference, to promote its scientificity. And at the stage of data collection, researchers need to enable the control of the invitation ways of social platform users and the stimulation ways, such as electronic red-envelope, to control the ways of network questionnaire’s diffusion and answer. At the stage of data processing, researchers should immediately check the data online, depending on the internal and external characters of network questionnaire, and clear data through certain statistical techniques.
Key words: network questionnaire; quality controlling; Respondent-Driven Sampling; online immediate check
一、引言
根据2017年中国互联网络信息中心发布的第40次《中国互联网络发展状况统计报告》[1],截至2017年6月,我国互联网普及率为54.3%。网民规模已经达到7.51亿,手机网民规模也达到7.24亿。互联网数字技术正在实现与经济社会文化等领域深度融合,并深刻改变着人们的工作生活形态。互联网应用范围和规模的扩展,为利用网络问卷搜集数据提供了巨大的便利。网络问卷调查是基于互联网技术手段,利用网页问卷、电子邮件问卷等网络媒介通信手段收集调查资料数据的调查方法。目前,网络问卷调查方法以其具有时间金钱成本的低廉性、操作的便捷性、调查的及时性等特点,被越来越被更多的市场调查公司、民意调研机构、政府调查部门和学术研究机构所采用。
网络问卷已经在社会学、教育学、新闻传播等学科被广泛应用,其在社会科学教学与研究中扮演着十分重要的角色。当前人们对其应用的质疑主要集中网络问卷的数据质量方面:网络问卷多采用非概率抽样,无法进行概率推论;使用网络问卷时,研究者不在现场,无法有效控制问卷的发放和填答过程,进而无法保障抽样过程的有效实施。在实际操作过程中,很多采取网络问卷调查的研究者似乎满足于以网络问卷数量作为调查数据自身正当性的依据,有意或无意地忽视了对网络问卷质量的追求。对于网络问卷调查而言,应答数量很重要,但网络问卷的应答数量及其相关的应答率(Response rate)不应该是衡量网络问卷数据质量的唯一指标或者最重要的指标。作为一位严谨的研究者,应该从网络问卷调查的整个环节审查数据质量。
对于网络问卷调查,国内已有少数学者开始关注网络问卷调查的质量问题,包括网络问卷调查的规划、设计及实施过程[2]、统计误差来源及控制方式[3-4]、统计推断问题[5],而对网络问卷的数据质量控制缺乏全面和深入探讨。如何通过移动智能终端的网络问卷获得高质量的问卷数据,成为研究者亟待解决的问题。基于此,本文从网络问卷调查的问卷设计、抽样、数据收集、资料处理等程序,详细探讨减少移动端网络问卷的抽样偏差和非抽样偏差的方法,以实现对问卷数据质量的控制,进而促进网络问卷数据质量的全面提高。
二、问卷设计中的数据质量控制
传统的网络问卷采用电子邮件调查、网页调查等方式,其对于网络系统和网络设备的要求比较高。随着移动智能终端的迅速普及和广泛应用,网络软件和硬件对于网络问卷的限制逐步被消除。研究者可以通过一些商用或免费的网络调查软件或者网络调查网站轻松地进行问卷设计。研究者需要根据自己的需求,选择一些系统稳定可靠、服务方便的网站或服务商,以保障访问的稳定性以及数据的安全性。在选定了网络问卷的服务系统后,研究者需要从两个方面来考虑问卷设计问题,进而在问卷设计过程中把控质量。
当前,研究者可以选取网络问卷的服务系统后,需要充分考虑移动端设备的特性,优化移动端网络问卷呈现方式。目前,移动智能手机的屏幕尺寸朝着大屏化的方向发展,移动端设备的屏幕尺寸对于网络问卷的限制作用日益微弱。已有研究证明,设备类型对于网络问卷数据质量的影响并无依据[6],因为经过优化的智能手机和计算机上的网络问卷几乎提供相同质量的响应数据[7]。因此,研究者需要重点关注如何根据移动智能终端的设备特点、以及其在移动智能终端的阅读习惯、操作方式等因素进行网络问卷设计,遵循以技术兼容性和操作方便性为主要内容的“友好反馈界面”的网络问卷设计原则[8]。具体而言,研究者需要针对移动客户端的特性对网络问卷进行优化,尽量为用户阅读、填答移动端网络问卷提供便利。第一,移动端的网络问卷长度不宜过长,以免对问卷填答者施加过多压力,进而降低了问卷反馈率和应答质量。第二,移动端网络问卷的翻页方式需要符合移动用户的阅读习惯和操作习惯。在移动智能终端,相对于分页设计,滚动设计可以加快完成时间、减少填答中止率[9]。对于移动端网络问卷,尽量采用垂直滚动方式呈现问卷,尽量减少翻页方式对于被调查者阅读和填答的干扰。第三,受制于移动端设备屏幕的限制,单个或者一组问题不宜过长,题干、选项、勾选框最好一并呈现。否则,在有限的移动端屏幕中,不能完整呈现一个完整的问题及选项,进而增加了被调查者的记忆偏差等问题。
在进行网络问卷设计时,研究者需要充分运用网络问卷调查的技术优势。具体而言,网络问卷的设计者要充分运用网络问卷的样本监测、自动跳转功能和数据检测功能。第一,研究者利用网络问卷的样本监测功能,可以将不符合研究要求的样本阻挡在样本数据库之外。通过限制问卷填答设备的IP地址等物理特征,可以避免同一对象多次填答或限制非研究对象进入样本库,实现了对于网络问卷填答者身份的初步筛选。第二,研究者利用网络问卷的自动跳转功能,既可以达到身份识别作用,又可以提高填答质量。这双重作用分别发生在两个阶段。在网络问卷的正式填答之前,研究者可以设置一些必答的身份识别问题作为身份过滤网。根据被调查者的回答,决定其是否符合研究对象的要求。只有符合要求,该调查者才能进入接下来的问卷主体部分。通过这种对网络问卷数据检测功能和自动跳转功能的结合,可以实现对问卷填答者身份的二次筛选,进一步促进了抽样方式的完善。在正式内容填答阶段,自动跳答能够简化问卷填答过程,减少人工跳答导致的失误,进而有助于提高问卷数据质量的精确性。第三,研究者利用网络问卷的数据检测功能,可以根据网络问卷内部数据特征,实现对网络问卷的数据清理。所谓数据检测功能,是指网络问卷利用其所依赖的硬件设备和问卷系统所提供的逻辑分析能力检测问卷填答者所填写的数据是否正确以及合乎逻辑,其执行的是纸质问卷调查中的事后数据清理任务。该功能能够在问卷填答过程中实现有效范围清理和逻辑一致性清理,促使问卷填答者提供符合要求的数据,有助于减轻后期数据审核的压力,进而在源头上提高网络问卷的数据质量。需要强调的是,研究者在设计问卷时,尤其是在利用上述三种功能的时候,需要重视网络问卷提示信息的作用。因为,能在纸质问卷收集过程中实施的现场指导或过程监控,在网络问卷调查中却难以实行,这也要求研究者在问卷设计阶段尽量认真审核每个题干和选项,对可能导致理解偏差或者填答错误的题目添加必要的填答提示。
三、抽样中的数据质量控制
网络问卷调查与传统问卷调查的抽样方式一样,分为概率抽样和非概率抽样。概率抽样的要求比较高,需要预先确定目标群体的总体,以构建符合研究要求的抽样框。使用网络问卷进行概率抽样,比较常见的情形是针对能够获得某一组织内部成员名单的“封闭目标人群”的抽样。然而,在现实操作过程中,由于这种“封闭目标人群”很少,并且往往不能满足研究者的研究需求。研究者经常面临一些分布广泛、高流动性、群体规模和边界不清或者一些身份比较敏感的群体。由于这些群体的特性,研究者无法获取符合研究者需求的抽样框。因此,非概率抽样方式成为网络问卷调查的主要抽样方式。研究者在进行网络问卷调查时,主要采用偶遇抽样、滚雪球抽样、判断抽样、配额抽样等非概率抽样方法收集问卷数据,以利用网络问卷调查所具有可及性高、成本低、操作便捷等特点实现一些概率抽样无法完成的调查研究。
然而,采用非概率抽样方法,由于各种条件限制,往往只能适用于进行探索性研究,而囿于无法进行统计推论而不能进行验证性研究。事实上,缺乏完整的抽样框或无抽样框是社会调查研究中更为常见的情形。研究者不能因为采取非概率抽样方式,便降低对于减少抽样偏差的追求。目前,国外研究者已经发展出一些特定的抽样方法或技术,使得研究者所获得的非概率样本尽量接近于概率样本,从而解决传统的非概率抽样无法进行统计推断的难题。抽样方法主要包括基于样本匹配的样本选择法和链接跟踪抽样方法[10]。前者利用样本匹配方法,可以实现从网络访问固定样本中获取代表性样本的目的[11];后者根据样本中的关系网络追踪和扩展样本,以使得非概率样本接近概率样本。
样本匹配方法适用范围有限,而链接跟踪抽样方法获得了较为广泛的应用。其中,最为常见的方法便是被访者驱动抽样(Respondent-Driven Sampling,简称为RDS)。被访者驱动抽样将滚雪球抽样和给与样本赋予权重的数学模型相结合。这种抽样方式激励受访者(也称为“种子”)推荐特定数量的同伴群体。在多次推荐以后,“种子”的选择便不会使样本产生偏差。这种方法不同于传统的抽样方式直接从样本推论总体,而是将先根据样本估计其所链接的特定的社会网络结构,然后再根据这种有规律的社会网络结构推断总体。被访者驱动抽样常用于研究吸毒者、无家可归者、艾滋病患者等这样的“隐藏群体”[12]。也有学者将其用于农民工这样的“非隐蔽群体”[13],并证明了被访者驱动抽样相对于传统的抽样方法所获得数据的精确性和稳健性。目前,被访者驱动抽样正逐渐成为一种适用于总体特征不明的中小规模群体,并且有效地进行统计推论的重要非概率抽样方法。
事实上,无论是否进行概率推论,研究者都应该积极改善抽样方法,以使得研究数据更能够接近目标人群的总体特征,进而提高调查质量。为此,研究者需要充分结合问卷设计、数据收集、资料处理等非抽样阶段,以处理抽样过程带来的抽样偏差。抽样偏差主要分为“未覆盖”和“不适合”两种情况[14]。针对“未覆盖”问题,研究者不能仅仅为了追求问卷的填答速度和数量而过于依赖单一的线上联系路径进行问卷的扩散与回收。要尽量丰富与被调查者之间的邀请路径,尽量使得更为多样的目标群体进入研究样本。这需要研究者事先通过行业研究报告、统计资料等多种方式了解被研究群体之间的异质性,以便确定调查群体的选取路径。在扩散网络问卷时,建议研究者同时在多个线上平台上联系潜在的调查对象。而为了保持数据的有效性,网络问卷的发放过程中需要谨防不合适”的样本进入数据库。由于网络问卷是通过线上扩散问卷,研究者往往很难直接确定被调查者的真实身份,这导致网络问卷很容易被“代填”或者“重复回答”。对于网络问卷而言,可以采用技术手段和人工方式解决“不适合”带来的抽样框偏差。一方面,在问卷设计阶段,需要利用网络问卷系统自身的技术优势对被调查者进行甄别。具体方法在问卷设计部分已经探讨,不再赘述。另一方面,人工方式则意味着需要对问卷数据收集过程进行监控。在数据收集时,研究者需要尽可能与扩散网络问卷的“中间人”认真沟通交流,尽量促使其将网络问卷扩散至目标群体。而在数据收集的同时,研究者要在管理后台对网络问卷进行即时审核,以便及时发现并处理进入数据库的异常数据。
四、数据收集过程中的数据质量控制
一份科学设计的问卷,在确定好抽样框之后,便进入数据收集的程序。在数据收集过程中,网络问卷填答者的邀请方式和激励方式是影响问卷质量的重要因素。邀请方式是指研究者将问卷递送至被调查者的联系路径。在移动互联网时代,社交平台正在日益成为网络问卷的主要邀请方式。这意味着网络问卷不再直接从研究者发送至目标人群,而是通过大量的社交平台的用户间接转发至问卷填答者。在这种问卷扩散模式中,社交平台用户作为“中间人”的地位得以凸显。社交平台的用户既可能是问卷填答者,也可能是问卷扩散者。依赖于社交平台用户扩散问卷的邀请方式特点,使得研究者部分失去了对于问卷信息的解释权,更在一定程度上丧失了对于目标人群的控制权。那么,为了保障网络问卷的数据质量,研究者应该如何应对网络问卷扩散过程中这两种权力的丧失?
对于前者,可以通过问卷设计中详细的提示说明加以解决。而对于后者,则需要研究者在进行移动端的网络问卷调查时,高度重视与社交平台用户之间的关系建设。研究者可以通过“关系建设”对扩散网络问卷的社交平台用户施加影响,间接增强对于目标人群的控制。在移动社交平台上,网络问卷的高效发放往往依赖于那些与目标人群联系紧密、且拥有一定权力的社交平台用户。这些“关键中间人”往往掌握一定的资源,拥有对目标人群的现实影响力。研究者需要与“关键中间人”进行信息交流和情感沟通,以获得他们的信任。随后,研究者可以促使这些“关键中间人”将网络问卷扩散至适当的目标群体,或者使“关键中间人”利用自身的影响力,敦促其所扩散的社交用户认真填写问卷,进而研究者在一定程度上间接影响了网络问卷的传播路径和填答者的填答态度,实现了对样本质量的控制。
研究者通过各种邀请方式接触到被访者以后,需要考虑如何使用激励手段促进被调查参与网络问卷。适当的激励手段不仅能有效提高网络问卷的应答率,也对网络问卷的数据质量产生重要影响。在PC端时代,网络问卷的奖励既可以采取传统的邮寄礼品等实物奖励方式,也可以采取提供电子礼品券等线上使用的奖品。在移动互联网时代,由于手机支付系统的发展,线下调查中原有的现金奖励方式在网络问卷的使用成为可能。在移动客户端,网络问卷的现金奖励往往以电子红包的方式存在,直接将现金存入被调查者账户。电子红包这种现金奖励的发放方式比事后通知的抽奖方式更能够增加网络问卷对潜在受访群体的吸引力[15]。
对于电子红包,需要综合考察红包的发放方式和额度设置对于网络问卷的影响。从红包的发放方式而言,根据发放的时间点,可以填答完毕后立即发放和问卷审核后发放。采取立即发放的红包发放方式,可以更为有效地吸引调查者参与问卷的填写和扩散,但是也增加了被调查者为了获得红包而恶意填答和扩散问卷的风险,进而降低了网络问卷的数据质量。采取问卷审核后的发放方式,拥有与前者相反的效果。而从红包额度设置对于网络问卷的影响来看,额度设置过高和设置过低分别与红包立即发放和审核发放对网络问卷的特性相似。因此,研究者需要综合审视电子红包使用方式对于网络问卷的影响,以取得既能拥有较高的应答率,又能保证数据质量的效果:对于红包发放方式,可以采取填答完毕后立即发放,同时研究者即时审核,以同时结合两种发放方式的优点;而对于红包额度设置,需要综合考虑网络问卷填写时间的长度、研究资金的充裕度、被调查群体的自身特点等多方面因素,既不能设置过低,也不能设置过高,寻求设置一个比较合理的红包额度。总之,对于红包奖励,需要在保障用户应答率的基础上,尽量降低红包发放方式和红包额度设置对于数据质量的影响。在实际操作过程中,研究者要在发放红包的同时,即时审核网络问卷。如果遇到问卷数量非正常的爆发式增长,需要及时分析具体原因,暂时停止接受问卷,并根据事情情况对问卷扩散路径进行调整和控制,以防止大量无效问卷或者低质量问卷进入数据库。
研究者通过邀请方式和激励方式促使被调查者填写问卷后,需要审慎对待网络问卷填答过程中的“无回答”现象,尽量减少无回答偏差对于数据质量的影响。一般而言,“无回答”意味着“无能力回答”和“拒绝回答”两种情况。对于“无能力回答”,研究者需要根据研究对象的特点尽量在问卷设计阶段优化网络问卷,适应被调查者的填答习惯。在数据收集过程,研究者主要需要解决“拒绝回答”这种最为常见的“无回答”情形。对于网络问卷中的“拒绝回答”,需要仔细分析是“拒绝回答”的类型。如果是项目无回答,则需要考虑问卷是否存在设计不周等原因;如果发现问卷填答者的基本特征过于单一,则需要考虑是否存在潜在的单位无回答,以及其背后可能存在的复杂原因。针对“无回答”,研究者不能毫无原则的无限增发样本,降低对于调查质量的控制。在仔细分析“无回答”的原因后,根据研究需求尽量完善抽样方式、邀请方式,以尽可能获得符合研究要求的样本数据。
五、资料处理中数据质量控制
常规性的资料处理过程包含原始资料的审核、数据编码和录入、数据清理等环节。对于网络问卷而言,其在填答完毕后,所搜集的数据便直接进入研究者的数据库,不需要研究者再进行编码和录入。因此,在获得网络问卷的数据后,研究者主要需要进行资料审核和数据清理两个环节。
对于传统的纸质问卷而言,资料审核包括实地审核和集中审核两种方法[16]。而由于在网络调查过程中,研究者往往无法控制网络问卷的填答和扩散过程,网络问卷往往无法直接采取普通的的资料审核方法。针对网络问卷,研究者可以采取线上审核的方式进行资料审核。根据研究者是否能根据网络问卷联系到填答者进行分类,可以将网络问卷的线上审核分为两种情形。如果能够辨别问卷的填答者并拥有被调查群体的邀请方式,那么,针对拥有填答错误、漏填等问题的问卷,研究者可以像实地审核一样,通过网络沟通渠道与被调查者进行联系,以修正、完善网络问卷资料。而在多数情况下,研究者并无法根据网络问卷追踪到该问卷的填答者,这意味着传统的集中审核方式的意义大打折扣,进而导致集中审核方式也不太适用于网络问卷。在这种事后无法匹配问卷填答者的情况下,如果遇到存在严重质量的网络问卷,研究者只能采取删除该问卷的方法。需要强调的是,为了提高审核效率,一定要高度重视网络问卷资料线上审核的即时性。这不仅仅影响到与网络问卷填答者核实信息的效果,也关系到网络问卷抽样方式的调整。为了提高网络问卷所搜集数据的质量,研究者需要时刻关注已搜集网络问卷数据的基本结构。如果在问卷审核中发现有过多不符合条件群体或者虽然符合样本要求但是比例过高的群体,研究者需要仔细考虑问卷的扩散路径,对问卷的抽样方式作出恰当调整。
在网络问卷的资料审核中,可以根据问卷的外部特征和内部特征甄别问卷的数据质量。对于研究者而言,首先可以根据问卷的外部特征将一些容易识别的、拥有质量问题的问卷筛选出来。问卷的响应时间可以作为衡量网络问卷数据质量的重要外部特征[17]。恰当的问卷填答时间是问卷填答质量的基本保障。具体而言,更长的时间并不能保障一定能够获得有效答案,而一份问卷的填答时间远低于平均填答时间,那么该问卷很有可能存在质量问题。如果填答时间高于正常填答时间数倍,有可能说明该问卷的填答者在填答过程中非常认真,也可能说明其在填答过程中注意力被其他事情所分散。这时,需要研究者重点关注这些问卷,仔细审查问卷答案的具体填答质量。如果一份问卷的填答时间极短,表明被调查者在在填答问卷过程中,省略了一些对于题干和选项的阅读理解和思考反馈过程[18]。这些问卷往往是填答者为了获取红包激励或者单纯为了完成填答任务而迅速填答的结果,这导致问卷答案不随着题干逻辑而变化,而呈现出相邻多组答案之间高度一致或者过于分散。此时,研究者可以根据这些特征将其定义为低质量问卷或者无效问卷。以响应时间作为外部指标,需要研究者确定合理响应时间的标准。对此,有学者提出了“完成时间”的概念。如果被调查者的响应时间低于所有填答者中值的60%,那么可以将这个问卷填答者定义为“超速者”[19]。
通过填答时间这种网络问卷的外部特征,可以帮助研究者高效地甄别出可能存在严重数据质量问题的网络问卷。在确定需要重点审核的问卷之后,研究者就需要根据被调查者提供的数据之间的内部逻辑判断网络问卷的数据质量。这就意味着,需要根据问卷的内部特征进行问卷质量的深度审核。所谓内部特征,是指问卷设计过程中问卷内部不同题干之间的逻辑关联。对于比较简单逻辑关系判断,可以在问卷设计时,利用网络问卷系统本身所提供的数据检测和自动跳转等功能的结合予以识别。而在资料处理阶段的人工审核,主要是基于研究者的常识、知识储备,对问卷内部复杂的逻辑关联做出分析,从更为整体的视角深入把握网络问卷的填答质量。具体而言,使用内部特征进行资料审核,主要依赖于研究者对网络问卷中预先设计的一些关联性问题和互斥性问题的答案进行判断。比如,不管是事实性问题还是态度类问题,同一用户所填答的两个或者两组关联性问题答案之间的逻辑联系应该是符合常识的。同理,对于网络问卷中的两组互斥性问题,除非选择中立的答案(比如“一般”),同一用户对于这两组互斥性问题的答案应该也是互斥的。如果同一用户的答案严重不符合网络问卷的内部特征,那说明问卷填答者很有可能没有认真阅读和填答问卷,进而研究者可将该问卷定义为低质量问卷。
在对网络问卷审核结束以后,需要进行数据清洗。借助网络问卷填答系统,研究者可以在问卷设计之时,对问卷答案的填答范围以及不同问题的逻辑关系进行设定,从而实现狭义的数据清洗。在网络问卷中的数据清洗,事实上主要指采用一定的统计技术方法在技术层面对数据进行清洗,以降低网络问卷调查过程中各个环节带来的偏差。目前,研究者已经发展了一些数据修正技术,以对网络问卷所搜集的数据的误差进行评估和修正。针对不同的数据误差来源,主要包括以下可供使用的统计技术方法:利用加权调整法修正网络调查覆盖误差与抽样误差;利用二级抽样和热卡插补技术修正网络调查无回答误差;采用混合效应随机化项目回答技术修正网络调查测量误差[20]。
六、结语
在当今社会,互联网技术、传感器设备等软硬件正在不断提升,这为网络问卷的广泛应用提供了众多便利。而相对于传统的调查方法,网络问卷调查本身能很大程度上节约了调查过程中时间、金钱、组织成本,并且具有很强的时效性,能及时应对日新月异的社会变迁过程。面对越来越边界模糊、充满流动性群体,网络问卷本身的优势日益得以体现。在这种背景下,如何获取满足研究者需求的高质量数据,成为网络问卷应用中的当务之急。因此,本研究分析了网络问卷,特别是移动互联网背景下的控制网络问卷质量的方法,具体从问卷设计、抽样、数据收集、资料处理等维度集中探讨了减少网络问卷抽样偏差和非抽样偏差的解决方式,有助于改善网络问卷的质量控制,进而促使网络问卷成为社会科学的重要调查工具,为社会科学实践提供真正有效的数据支撑。
参考文献:
[1]中国互联网信息中心(2017).第40次中国互联网络发展状况统计报告[EB/OL]. [2017-08-04].
http://www.cnnic.net.cn/gywm/xwzx/rdxw/201708/t20170804_69449.htm.
[2]陆宏, 吕正娟. 网络问卷调查的规划、设计与实施[J]. 现代教育技术, 2011(7):34-37.
[3]马慧敏. 网络调查中的非抽样误差来源与控制[J]. 统计与决策,2011(5):17-20.
[4]王华民.网络调查中的统计误差及控制措施[J]. 统计与决策, 2014(23):72-74.
[5]刘展.自选式网络调查的统计推断研究[J].暨南学报(哲学社会科学版), 2015(9):106-111.
[6]Sommer, J., Diedenhofen, B., & Musch, J. Not to Be Considered Harmful: Mobile-Device Users Do Not Spoil Data Quality in Web Surveys[J]. Social Science Computer Review, 2015(3):378-387.
[7]Andreadis, I. Web Surveys Optimized for Smartphones: Are there Differences Between Computer and Smartphone Users?[J]. Methods, Data, Analyses,2015(2): 213-228.
[8]赵国栋, 黄永中. 网络调查研究方法概论[M].北京:北京大学出版社,2007:173.
[9] Mavletova, A., & Couper, P. Mobile Web Survey Design: Scrolling versus Paging, SMS versus E-mail Invitations[J]. Journal of Survey Statistics & Methodology, 2014(4):498-518.
[10]金勇进, 刘展. 大数据背景下非概率抽样的统计推断问题[J].统计研究, 2016(3):11-17.
[11]刘展, 金勇进. 网络访问固定样本调查的统计推断研究[J].统计与信息论坛, 2017(2):3-10.
[12]赵延东, Jon Pedersen. 受访者推动抽样:研究隐藏人口的方法与实践[J]. 社会, 2007(2):192-205.
[13]刘林平,范长煜, 王娅. 被访者驱动抽样在农民工调查中的应用:实践与评估[J]. 社会学研究,2015(2):149-173.
[14]风笑天.社会调查中的无回答与样本替换[J]. 南京大学学报,2010(5):102-111.
[15]Tuten, L., Galesic, M., &Bosnjak, M.. Effects of immediate versus delayed notification of prize draw results on response behavior in web surveys: an experiment[M]. Los Angeles: Sage Publications, Inc, 2004.
[16]风笑天. 社会研究方法(第四版)[M].北京:中国人民大学出版社,2013:257.
[17]Greszki, R., Meyer, M., & Schoen, H. Exploring the Effects of Removing “Too Fast” Responses and Respondents from Web Surveys[J]. Public Opinion Quarterly,2015(2): 471-503.
[18]Krosnick, A., Holbrook, L., & Berent. K. et al. The Impact of "No Opinion" Response Options on Data Quality: Non-Attitude Reduction or an Invitation to Satisfice?[J]. Public Opinion Quarterly, 2002(3):371-403.
[19]GESIS. German Longitudinal Election Study [EB/ OL]. [2011-06-28].
http://info1.gesis.org/dbksearch19/SDesc2.asp?no=5346&tab=3&ll=10¬abs=&af=&nf=1&search=gles&search2=&db=D.
[20]冯缨,樊茗.网络调查数据质量控制的方法与对策研究[M].上海:上海三联书店,2013:197.