本体性意义与学科反思:大数据时代社会学研究的回应(一)

  关 键 词:大数据/理论终结/本体性意义/学科反思 

  作者简介:赵超越(1990- ),男,上海人,南京大学社会学院博士研究生,研究方向:当代中国研究、社会学理论、文化社会学,南京 210023

  从社会学学科总体发展的情况来看,定性与量化研究是两条并驾齐驱的方法学路径。但由于涉及主客观主义、事实与价值、理解与规律等诸多方法学的问题,两种研究方法在一系列的研究问题上又处于长期的纷争状态。而自大数据(Big Data)一词被提出并迅速成为当代最热门的研究主题之一,加上随之而来的全球性的时代浪潮,传统的量化研究方式受到了猛烈的冲击。

  大数据因其巨大的数据库存(在量上正趋向于全体数据)使得量化研究方法不再完全依赖于过去传统的抽样、假设检验,并为其研究的目的和内容提供了前所未有的便利。由此,大数据社会学研究应运而生。至此,量化研究在一些(暂且称之为)定量极端主义论者的鼓吹下逐渐占据了社会科学方法论领域的“霸权”地位;而与人文主义、建构主义相关联的理论研究、定性研究则逐步落入学科的“边缘化”处境。因而,本文的写作目的在于两方面:其一,从人类社会生活意义的视角对大数据时代下的方法学转向(以新计算社会学为主要形式)进行回应。因为方法手段上的纷争并非是大数据的根本局限性所在,而超越两种研究中的方法手段并站在人类社会历史生活层面上来看,其所具有的意义、意义的历史性与多样性才是大数据研究的软肋。也基于此意义,社会学等学科的自然科学化趋势才能被合理地反对。其二,大数据的到来和以此为基础的生活方式及全球格局的变化,绝不意味着传统研究的方法学和理论的终结。

  一、学科量化研究的来源与发展简述

  17世纪甚至更早,人们普遍受到自然科学的逻辑思维模式的影响,尝试去了解自然界乃至人类生活世界运行的规律,从而找出能够放之四海而皆准的普遍法则,同时,人们普遍追求一种可以计算和分类的方式来探求其中的知识体系。但是,即便研究对象是自然界,自然科学仍然受到人类主观因素或者其他非自然条件的影响,更不用说更为复杂的人类生活。所以,克服社会生活中诸多不可控因素的尝试,使得社会科学或者道德科学逐步发展起来。

  就社会研究中的统计而言,在三百多年前就已开始初步呈现。大致来说,在17世纪,这种尤其关注到规范、治理层面的技术同欧美当时所谓的统治理性是密切相关的。从词源学上来看,国家一词“state”就是统计一词“statistics”的原初形式,同样印证了统计的定量技术本身同国家统治的关系。而统计学(die Statistik)概念则由时任哥廷根大学的哥特弗里德·阿亨瓦尔(Gottfried Achenwall)正式提出。[1]19当时的目的无非是要寻求一个系统,在这个系统中政府能够更方便地记住其中人口数量及其各种社会事实,以便为其所用。英国、法国在这一方面大同小异,统计学最初的运用,是国家的领导者为了方便掌握其国家中人员的状况(人口容量、人口流动规模等),以便更好地实行统治政策和相关治理术。[1]16其中值得一提的是,当时国家的领导者和学者都或多或少地接触过类型学的思想,通过对所谓子民的数量以及活动轨迹的量化研究,实施对其不同职业、层级的划分,以便于对其监控。这个由统治者所构建的、社会成员受监控的社会,在很大程度上可以看作福柯所称的全景监狱(prison de panoramique)或者戈夫曼所说的“精神病院”(Asylum)的管理机制,统治者通过一系列的治理技术和设施对社会成员进行肉体和精神的规训,以至于他们终将成为温顺的受控者。[2][3]而随着社会形态的转变,尤其是从17世纪中叶伊始,“特别是资产阶级日渐掌握到社会的导引权,而市民社会(civil society)也日益成熟之后,其社会属性有了改变”,[4]统计研究不再纯粹为统治理性所服务,社会变迁过程中的诸多问题使得其研究目的发生改变:一方面为确信某个事实或某物提供理由(或支持涉及未来的决定);另一方面通过误差的理论(theory of errors)来评估科学知识的确定性程度(degrees of certainty)。[1]17由此,近代意义上的社会科学从之前统治理性主导时期的边缘地位脱离出来,朝更大的研究范围(自身研究逐步占主导)进行量化统计研究。

  而到19世纪末20世纪初,随着概率论的发展和成熟,量化研究逐步趋于数理化、公式复杂化以及模型化,并“展现成为一个具有自我组织、自我再制与自我衍生能力的语言体系”。[5]由于社会属性的根本改变,研究无法从绝对宰制的层面上获取所需的大规模数据,所以,与之前大规模的记录方式不同,近现代的量化研究以一个或多个研究假设为前提,通过对有限的样本规模进行梳理统计以建构不同的模型,从而凭借所得出的因果或相关关系来对当前假设进行验证。一方面,研究者尝试用量化的统计公式和统计模型来实现所谓的学科精确化;另一方面,由于自古以来一直有着对普遍主义的追求,使得量化研究愈发趋向于对人类行动乃至现象的发生进行预测。换言之,量化研究者从事社会学研究时已经采取了两种预设,即客观性预设和规律性预设。[6]95但问题在于,试图用上述两种去囊括所有的社会学研究是徒劳的。就前一个预设而言,所能获取的也只是表面上的外在行动(行动的频次、问卷上的信息等),这些外在数据只是社会学研究领域的冰山一角;后一个预设则更不可能实现,因为规律“只是在近似的情况下以及一定的限制条件下成立”。[7][8]在人类历史的多样化情形下,诸多自然科学中的定律和假说都是相对且不确定的。因此,利用量化的统计分析必须要对社会生活的诸多因素进行过滤和限定,才勉强能在“理想类型”的范围内着手进行。这样一种受限的量化研究,由于社会生活复杂性质的影响,“无法独自承担起社会学研究的重任”,[6]96它必须依靠定性研究进入意义世界的理论能力,方可更深入地解释和看待社会,同时它也能在定性研究的理论基础上呈现数字化的精确证明。所以,作为社会学研究的方法路径之一,量化研究不仅无法单独研究社会,更要时刻“向新的经验证据和反思的目光敞开”。[6]96

  但是,大数据以及相关新型数据采集手段的引入,似乎给传统的量化统计研究注入了一剂强心剂。在很多量化研究者看来,大数据在很大程度上意味着对传统的数据采集方法软肋的一种拯救,从而使其从原本诸多的手段限制中抽离出来。这样一来,社会学研究中新的重要问题便产生了:大数据研究究竟何为?既然量化研究和定性研究都有各自的本职工作,并分担研究社会的使命,那么大数据的到来在何种程度上影响这一格局?又在多大的程度上左右了定性、理论研究的作用?