数字时代社会调查的变与不变
来源:中国社会科学报 更新时间:2024-01-18

社会调查是搜集、处理社会信息的一种方法,在社会科学研究中发挥着重要作用。随着移动互联网、大数据、移动智能终端等的发展进步,社会调查领域也出现了一些新的变化。本报记者邀请浙江大学社会学系教授、浙江大学社会调查研究中心副主任刘志军和美国纽约州立大学奥尔巴尼分校(SUNY Albany)社会学系主任、纽约州立大学杰出教授,西安交通大学人文社会科学学院讲座教授梁在共同就数字时代的社会调查展开对话。
移动互联时代社会调查新变化
刘志军:长期以来,社会调查基本上采用纸质调查问卷的形式,在设计好问卷后,首先需要找人填写问卷,回收后再人工复核,剔除无效问卷,然后人工录入和校验数据,最后做分析研究。但在当今时代,基于网络、电脑和智能移动设备等的新调查形式日渐占据主流,传统的纸质问卷调查日趋减少。在您看来,我们应如何看待这种调查形式的新变化呢?
梁在:是的,如您所说,传统的纸质问卷调查在当今社会遭遇了很大的挑战,无论是市场调查、政府调查还是学术调查,都大量采用网上调查方式和计算机辅助访问调查(CAI)方法。因为这样的调查方法有很多传统纸质问卷调查难以比肩的优点,其中最重要的就是便捷和便宜。
刘志军:对此我有同感。我这些年做了很多调查项目,既用过纸质问卷,也多次采用了计算机辅助电话调查(CATI)、计算机辅助面访调查(CAPI)和计算机辅助网络调查(CAWI),深有体会。如果做纸质调查,问卷的印制、发放、填写、核查、整理、录入、比对等都费时、费力、费钱。而在以计算机为辅助的情况下,无论是用电话、平板电脑还是手机来做调查,至少降低了问卷印制、问卷录入、核查比对的时间和费用,还能实现自动的逻辑校验,获得实时数据反馈。如果采用计算机辅助面访调查,还能利用移动设备的定位、拍照、录音、录像等功能,实现纸质问卷调查无法实现的诸多质量控制功能。
梁在:确实没错,我这些年主持的学术调查项目,也主要采用了您说的这些新调查方法,比较方便,也能节约费用。关于这些新调查方法尤其是网络调查方法的好处,除了这些以外,还有一个也很重要,那就是当调查涉及比较敏感的信息时,新调查方法更为有效。每个人都有其不愿轻易对外透露的敏感信息,对相关敏感问题的警惕性,在美国是比较突出的,如果面对面让对方填写纸质问卷,很难收集到真实数据。但采用计算机辅助自助调查(Computer Assisted Self Interview)方式,让被访者自己在电脑或手机上匿名填答,他们就会比较放松,原来不好意思或不敢回答的,也会填答,回答率及回答的真实性均会提高。
刘志军:您说的这个优点确实特别重要,正因为有了网络和计算机、移动终端,才使得这样的调查成为可能。不过,虽然传统的纸质问卷调查日趋减少,但并未被完全取代,因为不同的调查形式各有优劣,所谓“尺有所短,寸有所长”,各种方式方法都不可能被完全替代,新旧社会调查形式将会长期并存。请问您对这个问题怎么看呢?
梁在:没有哪种调查方法是十全十美的。计算机辅助调查尤其是其中的网络调查现在很流行,毕竟简单方便,但确实也有很多难以克服的缺陷,使得调查质量参差不齐。以网络调查为例,其中最受诟病的就是样本的代表性,因为抽样框不好确定,每个人被接触到的概率及问卷填答意愿并不相同。正如大家已经熟知的那样,不同年龄、文化程度、社会阶层人群的网络可及性、网络使用频率、网站偏好及网络调查接受度等都有显著差别,这些都会加大样本的选择性偏误。
刘志军:这确实是制约网络调查发展的一大挑战,需要积极探索应对办法。我注意到学术界已经提出了一些非概率网络数据收集的替代方案。一是河流采样(River Sampling),即拦截浏览网络者并通过问题作筛选后引导其进入特定调查。二是样本匹配(Sample Matching),采用一组变量对非概率抽取的大样本中的个体与概率抽取的大样本中的个体作匹配,然后邀请匹配后的非概率样本中的个体完成网络调查。三是利用学术界在对敏感人群做线下调查时经常使用的被访者驱动抽样(Respondent-driven Sampling)来招募网络调查对象。当然,对于这些替代方案的有效性,学术界还存在一些争议,但至少表明,通过采取新的措施,我们可以在不损失太多样本代表性的同时,充分发挥网络调查的便捷和便宜的优势。
梁在:是的,遇到新问题就会有人去研究解决方法,相信经过一段时间的探索、检验,迟早可以解决这些问题。我自己印象比较深的是两步抽样法(Two-steps Process)。我曾参加过美国某机构开展的高等教育调查,先后收到了两封纸质邮件。对方先是通过大学相关部门获得了毕业生的通讯地址,随机抽取后,发送第一封纸质信件,确认个人信息并征得同意后,再寄第二封纸质信件,告知网络调查问卷的链接,链接中是一份大约需要15—20分钟来完成的调查问卷。这实际上是自填式网络调查和邮寄式纸质问卷调查的结合,先通过纸质邮件联系随机抽取的毕业生,获得同意后再开展网络调查,既提高了调查效率、减少了调查成本,又能保障样本的代表性。
移动智能终端影响调查
刘志军:您说的这种两步法是很好的设计,是传统和现代方法的巧妙结合。可见网络填答问卷的形式其实是可以普遍应用的。另外,由于移动智能终端的普及,很多网络调查是通过手机和平板电脑等完成的。严格来说,计算机辅助调查技术的说法已经有点过时了,因为手机和平板电脑等移动智能终端与传统的计算机在功能上已大不相同,在人们生活中扮演的角色也有很大差异。刚才我们谈的是网络调查的优点和不足,接下来能否请您谈谈智能手机对社会调查的影响呢?
梁在:没有智能手机,要在高度数字化、网络化、智能化的社会立足,是难以想象的。正因为智能手机走入了千家万户,长期以来的计算机辅助电话调查已经难以为继,因为使用座机电话的人越来越少,基本上只是作为公务电话在使用,如果用座机号码来做抽样和调查,回答率和配合率都很低。
刘志军:您谈到的这个问题确实很突出。我所在的浙江大学社会调查研究中心的电话调查,最开始都是用座机号码抽样的,效果不错。大概从2015年开始,抽取座机号码做社会调查就越来越难了,不得不扩展到手机号码抽样。但通过手机号码来调查,常常遇到被拉黑名单、被投诉等问题,也是困难重重。
梁在:是的,现在手机越来越智能,可以设置黑名单,可以智能拦截陌生来电,所以美国这边的电话调查也是处境堪忧,因为访问成功率太低,调查成本高昂。不过,手机等智能终端的普及,对于做社会调查而言好处颇多。随着手机功能的增加和完善,我们可以完成很多此前做不了的调查。例如,2013年普林斯顿大学几位教师做的一项调查就充分利用了手机的定位功能。我们以前研究种族隔离,主要依据普查资料,看小区住户的种族构成。但这种传统方法有缺陷,因为不仅仅要看生活住址的地理分布和种族构成,还要看工作地点的地理分布和种族构成。根据手机定位,可以看到受访对象白天在哪里工作或停留,这有利于我们更精确全面地了解种族隔离的真实情况。
刘志军:这个功能确实很实用。我们这些年做大型社会调查也都利用了手机和平板电脑的定位功能,以核验调查员是否就位。
梁在:手机的定位功能还有其他很多用途。例如,以前我们问别人的主观幸福感,是不分所在地理位置的,默认不会受所在地的影响,但实际上并非如此。通过手机定位,我们可以问询被访者在不同性质、不同距离的位置的主观幸福感,以探究其在家中、在工作地、在出差地时主观幸福感的变化以及这种变化与人口学特征的内在关联。这是传统调查手段很难做到的。
刘志军:您说的这几个例子对我很有启发。此前我听说您在做留守儿童调查时也收集过空间定位信息,请问您具体是如何设计和操作的?
梁在:我们在陕西做调查时采用了这样的方法,面向的是小学四年级的留守儿童。因为孩子们没有智能手机,学校也不允许学生使用手机,我们使用的是一种轻便的方便佩带的定位器,被抽中的学生需要佩戴该定位器一周。如果某位学生在某个地方停留10分钟以上即会留下定位记录,通过与地理信息系统比对,我们就能了解其去零食店、网吧、同学家等场所的频次、时长、时间段等信息。
刘志军:您的这个方法很巧妙,我这些年也在关注留守儿童过量摄入垃圾食品的问题,今后可以借鉴您的做法。当然,您收集的地理空间定位信息是全方位的,不仅涉及零食店,还有网吧等娱乐场所。我注意到您特意提了“同学家”这项信息,请问为什么要特别关注这方面的信息呢?
梁在:这是为了分析朋友圈的相关议题。我们请被抽中的学生指出在他们心中是其朋友的人,即提名朋友,加上空间定位信息,就能考察这些学生的交友网络与空间网络关系等。我们关心的问题是,留守儿童身份是否会导致其他人不太愿意与被抽中的学生交朋友,从而导致他们需要到别的村去找有类似经历的人交朋友。
刘志军:确实,通过问卷调查了解学生自己提名的朋友,再与实际的活动空间轨迹结合起来,就能发现很多被忽视或通过传统调查方法难以获得的信息。虽然这次调查用的不是通常意义上的手机,但能定位,还能联网发送位置信息,可以视为一种具有部分手机功能的移动智能终端。可见,我们需要进一步修正对计算机辅助调查工具包的认识,不但要从传统的台式机拓展到手机、平板电脑,还应该拓展到可以联网或记录、保存空间定位等信息的移动终端设备。
梁在:没错,有智能化、数字化功能的设备都可以用来帮助我们完成社会调查。当然,由于手机是我们现在常用的、功能全面的移动智能终端,它的作用也就最为凸显。
刘志军:智能手机可以保存大量个人信息,后台已经积累了海量数据,很多学者都在利用这样的大数据做研究。
梁在:除地理轨迹外,手机还能保存很多与健康有关的信息,后续有很多数据可以挖掘,只是因为涉及隐私和数据壁垒问题,用起来会比较受限。
大数据与社会调查互补
刘志军:提及智能手机网络背后积累的大数据,我不禁想到,曾有那么一段时间,学术界热烈讨论过大数据时代是否还需要去做问卷调查。不过,如今已经证明大数据并不能取代问卷调查。大数据的可及性、厚实度、隐私性都限制了其有效利用。不过,由于大数据本身具有真实可靠、整体全面、数据海量等天然优势,还是大有可为。
梁在:这个是共识,毕竟大数据太强大了,难题是如何获得、处理、使用。现在大数据得到广泛应用,在社会研究领域,很多有价值的研究项目都在挖掘利用大数据。例如,哈佛大学的一个团队就在利用美国联邦政府税表数据来研究是否还能实现所谓“美国梦”及其中的细节问题。美国的税表数据里含有住址和精确的收入等关键信息(一般的社会调查收集不到精确的收入信息),包括父母、子女及其在不同年龄阶段的数据,还可以获得精确的地理位置,再加上出生地点、种族类别、迁移史等数据,就能比较分析不同种族、不同出生地点、不同类型迁移、不同世代的情况。其中比较有意思的一点是看不同年代出生的人的“美国梦”。人们普遍认为,二战以后出生者是容易实现“美国梦”的,千禧一代(指20世纪八九十年代出生的人)尤其是其中的少数族裔的“美国梦”是否能实现就要打问号了。通过对税表数据的分析可以准确细致地回答这个问题。
刘志军:看来大数据确实能解决传统调查难以解决的难题。不过,大数据是一种被动存储的数据,有社会调查的介入,才能让大数据获得更好的利用。如果要作细致的过程和机制分析,还要通过问卷调查和个案访谈去获取更多的关键变量信息。
梁在:是的,大数据虽好,但往往缺乏必要的人口学特征信息和背景信息,需要与介入性社会调查相结合才能分析得更深入,更有社会研究价值。
刘志军:您说得很有道理,我很赞同。在今天这样的数字化、智能化、网络化时代,我们不能对新出现的大数据视而不见、避而不用,但也不能因此就忽视了传统的社会调查,只有将大数据和通过问卷调查、深入访谈、社会实验等获得的数据结合起来,才能更好地做社会研究。
问卷调查与其他数据的结合
梁在:那当然,问卷调查不仅要与大数据相结合,还可以与一些称不上大数据但也非常有用的数据结合起来使用。近年来,学术界有将问卷调查和行政数据(Administrative Data)结合起来做社会研究的趋势。例如,美国有个“高中生追踪调查”(High School Longitudinal Study),是2009年开始的,参加的都是九年级的学生,在这些学生2012年高中毕业时做了跟踪调查,看他们是顺利毕业还是中途退学了,成绩等表现如何,然后又在2016年他们大学毕业时做了回访。该项目既做了学生、家长、教师等的调查,也收集了学生历年成绩、教师构成、开设课程、训练项目等行政数据,可以据此分析在高中参加哪些活动最有助于学生考上大学、少数族裔师资数量与学生学习动力的关系、为学生提供的科学训练项目的绩效,等等。这种结合是很好的创新做法。受此启发,我前些年在四川、陕西等省份做调查时也采用了类似方法。例如,针对四年级学生,我们收集、分析了其1—4年级的成绩数据,以便精确描述留守经历和学习成绩的关系。
刘志军:您基于这些数据写的论文我已拜读过,这种结合调查数据和行政数据的研究确实更有说服力。除此之外,学术界也常常将调查数据和生物医学指标数据结合起来做研究。此前也听您提及一些相关调查研究,我想这应该是另一个比较有前景的社会研究范式。
梁在:是的,这种做法在与健康有关的研究中越来越受欢迎。通过问卷调查可以获得经济社会指标等变量信息,同时可以采用生物医学手段收集相关生物性信息。例如,为了了解大学生饮酒行为的影响因素,美国北卡罗来纳大学教堂山分校的研究人员曾经做过有关大学生“喝到烂醉”(Binge Drinking)的研究,除了调查朋友网络外,研究人员还考察了个人基因这样的生物医学指标。做法是通过采集唾液来测DNA,看哪些基因与饮酒有关,然后和社会网络等变量一起纳入分享模型。这样的调查很多,在美国的纽约州曾有学者做了一项为期5年涉及6000名儿童的调查,他们在问卷之外,还收集了儿童的脚指甲,以便考察环境中铅、汞等金属的含量与儿童健康之间的关系。
大型社会调查的设计与合作
刘志军:我们刚才主要针对数字时代的社会调查和围绕社会调查的研究展开对话,对新出现的一些变化进行了初步梳理,我个人很有收获。但变化的调查形式背后很可能还是那些不变的调查内容,毕竟人的基本需求和社会的基本问题总体来说是不变或变化缓慢的。针对这些基本问题,中国近一二十年来开展了很多大型追踪调查,投入很大,产出也越来越多,影响力日益提升。
梁在:正如您所讲的,虽然新的时代会有新的社会问题出现,但很多基本问题会持续存在。因此,许多社会问题是值得做长时间追踪调查的,这对于保存人类社会的历史数据资料、诊断当下社会问题并献计献策、探寻人类社会发展规律等,都是不可或缺的。中国人口多、经济体量大、社会变迁速度快,特别需要针对很多经济社会现象做持续性的抽样调查,这些年也确实取得了很大进展。
刘志军:当然,美国学术界开展这类调查的历史更长,富有经验,中国学术界从美国同行所做的相关大型追踪调查中获得了很多启示,也提供了大量的技术支持,今后还需要继续学习借鉴。
梁在:是的,美国的部分大型社会调查项目持续时间长、积累丰厚,值得学习。目前来看,除了中国学术界熟知的美国综合社会调查(GSS)以外,还有几项调查值得借鉴。一项是北卡罗来纳大学教堂山分校主持的“全美青少年至成年健康纵向追踪调查”(The National Longitudinal Study of Adolescent to Adult Health),调查的是1994—1995年美国7—12年级青少年的全国代表性样本,迄今为止开展了五波追踪调查。另一项是莎拉·麦克拉纳汉(Sara McLanahan,已故,生前为普林斯顿大学社会学教授)主持发起的“脆弱家庭与儿童福祉调查”(The Fragile Families and Child Wellbeing Study),2023年更名为“家庭未来和儿童福祉调查”(The Future of Families and Child Wellbeing Study),是基于1998—2000年间在美国人口超过20万的城市出生的4898名儿童样本做的追踪研究,至今已收集了7轮数据。还有一项是美国收入动态追踪调查(The Panel Study of Income Dynamics)。密歇根大学于1968年发起了这一调查,随机抽取了来自5000个美国家庭的18000多名调查对象,并持续对这些人及其后代进行追踪调查。这是世界上运行时间最长的纵向家庭调查,美国国家科学基金会将其视为历史上资助过的60项最重大项目之一。
刘志军:您说的这几个大型调查项目关注的都是重大社会问题,能长期坚持,难能可贵。除了您提及的这些项目外,北卡罗来纳大学教堂山分校自1989年起做的“中国健康与营养调查”(China Health and Nutrition Survey,CHNS)也为大家所熟知,您的导师、美国社会学家道格拉斯·S.梅西(Douglas S. Massey)联合其他学者做的“美国新移民调查”(The New Immigrant Survey)等追踪调查也影响广泛。
梁在:当然,中国这些年已经快速赶上了。还有一个可喜的现象就是中美学术界合作开展相应调查,除了北卡罗来纳大学教堂山分校已经做了很久的“中国健康与营养调查”外,还有新冠疫情期间,吴晓刚教授与美国综合社会调查团队成员之一迈克尔·豪特(Michael Hout)合作,做了一项全美抽样调查,了解美国人对中美关系的看法。这项调查如能坚持做下去,将很有特色和价值。
刘志军:是的,中美都是大国,两个国家之间有文化差异,也有全方位的交流互动,两国面临一些共同的社会问题,分别开展长期深入的社会调查,同时保持密切交流与合作,对于两国人民的福祉意义重大。社会调查的方法和形式会跟随时代的脚步而发展变化,但许多社会问题是人类面临的普遍性问题,需要长期关注。更重要的是,即便问题内容、调查方法变化了,人类社会通过社会调查来自我剖析、自我反思、自我超越的需求是永远不变的。从这个意义上来讲,变化的是社会调查的形式、技术和内容,而社会调查作为认识社会的重要科学手段这一点却是不变的。