走出定量社会学双重危机
陈云松
摘要
定量社会学研究已不再满足于数据描述和限于浅表的关联分析,而是开始真正承担起解释、预测社会实质的学科使命。近十年来,我国定量社会学发展迅速,但也遭遇了双重危机——基于内生性问题的因果逻辑危机和基于时空问题的理论视野危机。双重危机交织在一起形成了目前定量研究的四“多”四“难”:多基于截面数据,难以进行因果推断;多囿于个体层面,难以进行宏观检验;多忽视濡染机制,难以进行空间分析;多限于当代调查,难以进行大历史研究。走出双重危机有“五大取径”,即追踪时间差异、培育实验思维、关注濡染机制、构建宏观测量和再建理论思维,定量社会学研究新范式可以在四个方面实现新的突破,即研究论据复合化、检验方法复制化、呈现方式精炼化、研究目标科学化。
关键词:定量研究 定量社会学 量化分析 因果分析 时空分析
一、导言
定量社会学,即以数据为基础,以统计方法为手段对社会结构、过程和现象等进行证实或证伪的社会科学。定量社会学自发轫以来,以其数据的代表性、模型的规范性和统计规律的客观性,在很短时间里就激荡起巨大的学科回馈,并迅速积累起蒸蒸日上的学术声望与地位。尽管人类社会现象较之物理、生物等自然科学现象远为复杂多元,尽管量化方法和其他任何一种研究方法一样具有自身的局限性,但以数据方式对人类社会的实质进行观测、描述与解析,是对人文社科领域研究传统的思辨模式和个案模式的重要补充,更是一场激动人心的时代革命。毫无疑问,无论是在西方还是在中国,无论是经济学、社会学还是政治学,甚至历史学,定量研究的思维和应用,已经成为当代人文社科最具活力、最有潜力和最有利于形成公共学术智业的前沿。
从定量社会学的发展来看,自上世纪80年代以来,基于社会调查问卷数据,使用经典的线性或非线性计量模型(诸如OLS、Logit、多元或序次Logit等)进行变量关联的参数估算,一直是占据主导的研究手段。由于这些经典模型既简约、规范,又能通过多元变量的控制模式充分考量复杂多元的人类社会现象,它们迄今仍是社会学期刊、著作等主流学术阵地中最常见的分析武器。不过,随着社会学家数据搜集渠道和研究视野的不断拓展,以及发展与使用高级模型能力的快速提升,定量研究者已不再满足于早期的数据描述和限于浅表的关联分析,而是逐步开始承担起解释社会和预测社会的学科使命。
定量社会学研究者对于该使命应具有一种当仁不让的勇气与担当,这是因为,在传统思辨研究和个案分析占据主导的社会学草创时代,人类对社会现象和过程的理解,往往依赖于少数社会学家特别是理论家、田野工作者的直觉和体悟。而在今天,随着理论空间的进一步逼仄,传统理论研究者深陷概念的同义反复陷阱,面临把理论研究或降格为理论史钩沉、或引向本学科无力驾驭的哲、史、艺术等学科边缘的局面;而扎根于社会个案的质性研究者,自始至终受制于个案局限的解释无力感。唯有定量社会学,可以起步、受益并深深根植于社会学传统的理论和质性研究,合理地运用数据和统计铁律来真正实现社会学人解释过去、预判未来的学科使命。面对传统思辨研究与生俱来的个人克里斯玛,面对质性研究因深耕现实而收获的田野传奇,当代定量社会学者必须做出一种自我牺牲,放弃研究方法本身对于学者个人魅力的光环,坚持不以方法论上的不食周粟为荣光,背负起不再以情怀为研究至高追求的精神十字架。
对于中国社会学家而言,要真正承担这一使命,靠的不仅仅是一代社会学人在方法视野上的移形换步和少数极优秀学者能攀登到的学术高峰,而应该是整个学科阵营在理论视野、田野精神、科学素养和分析工具的全面现代化。对于定量学者而言,这首先要求所定量分析必须达成积累、形成脉络、养成与国际学界对话的自信与视域。幸运的是,中国定量社会学研究的后发优势,使得我们并没有落在这一时代使命之后。以《社会学研究》为例,其创刊30年以来,量化研究一以贯之保持了相当的强势(图1)。实际上,在改革开放后重建中国社会学的第一个十年,定量研究就已占《社会学研究》同期论文总量的23.8%。在经过第二个十年的盘整和微调之后,定量研究在第三个十年迅速攀升至26.5%。这一比例,虽仍不及国际顶级期刊,但若考量述评、书评类文章的份额,量化论文的比例实际还会更高。更重要的是,大数据研究表明,量化分析领域的杰出华人代表,其全球知名度已经可以和当代国际社会学诸多大家并驾齐驱。这一系列事实,充分体现了立足中国数据、发微中国国情的定量社会学研究,不仅已经具备了与国际顶尖同行对话的格局、高度和底气,更率先走在了建设中国特色、中国风格和中国气派社会学研究的最前列。
更为可喜的是,近十年来,中国定量社会学的方法进步令人瞩目。特别是,探索多元融合的定性定量混合研究方法,致力于解决估算偏误问题的工具变量、固定效应、倾向值匹配等分析手段,以及以大数据、仿真建模、量化历史为代表的新领域和新路径不断涌现。这使得中国定量社会学研究,已经从20世纪80年代的学步、90年代的追赶,在21世纪初转入与全球社会学研究前沿进行对话的历史新阶段。不过,恰恰因为定量方法的方兴未艾,在这个重要历史关隘,对我国定量社会学尤其是方法发展近十年的重要过程特别是方法危机进行回顾、反思和梳理,对加深定量研究历史使命和目标的理解将有裨益。较之欧美等西方社会,中国社会身处改革、转型的洪流,在诸多维度具有更为多元、复杂和微妙的结构过程特征,更需要社会学研究者在扎实和富有想象力的理论思维之上,发微统计原理,精通科学手段,直面学术瓶颈,走出研究危机,以此来正式告别纯思辨、纯个案的社会学手工作坊研究时代。
二、交织的双重危机
在21世纪,对定量分析的抽样代表性问题、数据可信度问题、模型适用性等等的传统批评,都已成为昨日黄花:随着数据搜集能力的不断强化和计量模型技术的不断提高,这类议题都已得到理论和学科实践上的合理解决,不再成为针对定量研究的的批评热点。换言之,以往对定量研究的批评,基本是对早期不成熟、不规范的量化研究的反思。而在今天,从数据质量、计量方法和研究设计的专业角度,从事理论或质性研究的学者阵营,已基本无力对定量研究进行具有真正学术对话意义的批判。但定量研究者决不可因此而沾沾自喜。这是因为,定量研究虽可暂时搁置为人文精神家园添砖加瓦的历史担当,但对社会实质现象进行具有因果逻辑的分析推断,对宏观社会结构进行大历史、大时空的科学解读和预判,乃是定量学者不可推脱的时代使命。而中国定量社会学人在这一使命面前,仍然没有做好充分的历史准备。特别是,质性学者所习得的抽丝剥茧的逻辑精神,理论学者所习得的宏大理论视野,是定量研究者超越畛域之见,迎接学科使命担当的必修课,是真正实现社会学现代化的不二法门。实际上,新世纪以来,在高歌猛进之际,中国社会学定量研究也逐渐面临交织往复的双重危机。
(一)因果逻辑危机:内生性问题的困扰
无论是诠释还是预测,社会学定量研究的终极价值均立足于因果分析。然而,当涉及证明某个“因”会带来一定的“果”,给予调查数据的社会科学研究就必须面对一个永恒的挑战——“内生性”(Endogeneity)问题。此问题一言以蔽之:由于总有某种无法观测的个人能力或者异质性的存在,基于观测数据的定量研究,其单方程经典回归模型系数统计显著与否,本质上只能说明该对变量在统计上是否具有关联,至于孰因孰果,以及这一关系的真正体量,却因偏误重重而无力推断。此间最经典的比喻莫过于打雷和下雨:雷电与雨水的统计关联显而易见,但雷恰恰不是雨之因。从模型角度,广义的内生性问题除前述的遗漏偏误之外,还有自选择偏误、样本选择偏误和联立性偏误等诸多来源。这一核心问题,尽管谢宇等国际华人学者早在20世纪90年代就已有关注,但囿于当时国内外学术交流和定量研究进展的差异,并未获得国内学界的关注。
直到进入21世纪的第二个十年,才有大陆学者在社会学期刊中正式就内生性问题进行系统阐述。尽管量化分析方法发展迅速, 但我国社会学定量研究总体上对内生性问题认识不足,且囿于研究设计、数据质量和模型设置,仍停留在简单统计回归的验证关联阶段,缺乏基于因果推断的解释能力。
公允执论,对内生性问题的漠视,并非仅仅是中国社会学界的危机。在国际定量社会学研究文献中,该问题也只是在21世纪初期才获得全面的警醒。其间,较为著名的就是美国学者莫维(Mouw Ted)在2003和2006年对社会资本研究内生性问题的实证研究和方法梳理回顾。莫维提出,无法观测的个人的能力、性格甚至人以类聚的社会关系特征,也即模型中的遗漏变量(Omitted variable),可能才是社会网(如关系)看似有用的真正原因。这意味着,社会关系本身只是人与人之间选择性的“果”,而不是真正影响求职求学的“因”。莫维这一质疑,基于高级计量模型,直接对以林南和边燕杰为代表的社会网、社会资本学派构成了强大的挑战。此后双方辩论长达十年,皆因彼此阵营对内生性问题本质的认识存在差异而迟迟未能终结,直到2016年新的实证研究问世后才初步达成共识。
除了社会网和社会资本研究之外,在中国社会学定量分析的其他领域,内生性问题还远远没有像经济学、教育学等领域那样得到足够的重视。本质上,解决内生性最简单直接的方法就是对社会分析对象进行自然实验。然而,和心理学、生物学和医学实验不同,社会实验受到研究伦理的极大限制,因此几乎注定无法成为社会科学研究的主导方法。也因此,只要基于问卷调查数据的定量研究长期存在,内生性问题就会是一个永远悬挂于社会学定量学者头顶的达摩克里斯之剑。基于问卷数据的定量研究者,在内生性问题的威慑之下,也就必须始终依赖高级计量模型和具有足够信息量的数据,才能对社会过程和现象进行真正有说服力的分析解读。
从学科内部结构的角度,内生性问题足以对定量社会学带来重大危机,乃是因为:如果定量社会学家无法为社会过程提供具有因果逻辑的证据,就会丧失其在学科维度的发展优势。简言之,思辨研究者,凭借学者的抽象思维能力和学力积淀,可以对社会的过去、现在和未来进行充满才华的描述、解读和诠释。尽管这种解读不一定有数据和实证的基础,但听众们对于思辨研究、田野研究的期许,恰恰是情怀、直觉、充满艺术感的语焉不详或充满现场感的事无巨细,而未必会把严密的因果逻辑和统计证据作为对治学者的要求。但定量研究者的听众则大相径庭:他们往往更以因果链条和统计可靠性作为衡量研究结果的重要甚至唯一的准绳。也因此,失去因果推断,对于思辨型学者,可能只是失去了枷锁。但对于定量学者,失去了的是刀的刃、箭的簇、枪的尖,失去的是自身学术的价值基础。
(二)理论视野危机:研究时空的窄化与滞后
理论的缺位,或者说对理论的淡化,是中国当代定量社会学研究遭受传统思辨研究者批评的重要方面。理论化的不足,对于定量社会学来说,实际上是一种视野的不足,而非方法的不足:起码在中国的定量社会学人,几乎没有一位不是从传统的思辨和理论训练体系中成长和走出的。翻出中国定量社会学者在学术生涯早期阶段的理论作品,其分量绝不比其他任何领域的社会学者来得轻。那么,为何定量社会学作品往往显得无趣、缺乏理论的锐度和吸引力?
社会科学研究的基本原理之一,乃是社会情境,即群体差异性的模式会随社会情境的变化而变化。而时间和空间,或者说时空,恰恰是界定社会情境的重要维度。从三十年国际国内定量社会学发展的轨迹来看,传统分析层次通常为问卷调查的个体。然而,大量的社会关系和社会过程,如社会制度、法律、文化等,都是宏观层面的社会属性并非个人属性,也往往无法通过基于个体层次的微观分析而得到观测和分析:唯有具有大时空视野,才能提出这类问题、分析和解答这类问题。受限于传统的调查研究数据、学科模式的谨小慎微(诸如对“生态谬误”的恐惧),定量学者们三十年来纷纷习惯于对个体样本数据的观测研究,这种研究视野的窄化,非但让定量社会学研究的领域和对象不断固化、矮化,让学科成果在社会大众面前显得琐碎而了无趣味,更容易让定量学人不再对宏观社会现象具有理论使命感,甚至走向自我封闭的道路,以沉默的大多数心态,来消极看待思辨型学者对历史现象、大跨度空间社会现象进行多度的个人化解读,放弃自身作为学者对社会思潮的历史担当与责任。尽管定量学人在从事社会学研究之初,往往都具有良好的理论基础和质性训练,但随着量化研究的不断重复、积累,随着个体调查数据分析思维模式的深入骨髓,反而逐渐变得漠视和淡忘理论,这使得本可以一举超越传统理论研究和质性研究的历史机遇,在一定程度上未能被及时把握。
同样重要的,较之书斋中的思辨和田野间的访谈,定量研究必须依赖于高质量的数据生产。而获得高质量的数据,耗时既长,人力物力投入也往往非学者个人所能及。因此,数据作为分析工具的天然滞后,必然导致了一种学术过程的后撤:对于现实具体重大社会变迁的把握和重大问题的发现,思辨研究的理论家和田野研究的发现者,似乎总能走在历史的潮头,走在定量学者的时间前方。也恰恰因此,甚至有学者认为,理论和定性研究,是定量分析的基础。当失去了研究的历史先机,当获得“发现者”、“首倡者”这类荣誉的概率略低,定量研究者们也就自然容易满足于对既有理论的证实证伪,甚至滑向依托现存数据和问卷,闭门造车做模型、纯为发表而写作等等误区。这样,和理论家容易滑向过度制造概念、质性研究者容易滑向过度解读如出一辙,分析工具层面的时滞问题,一个纯粹技术的问题,逐渐发展、积累成为定量学者群体中更容易出现的自我复制、自我陶醉的旨趣问题。
因此,视野的危机,其实不是人的危机,不是学力高低的危机。作为定量社会学面临的方法危机,它最初来自于数据层面的过度微观化和生产滞后性,并逐渐发展成为一种分析时空、理论视野的窄化,以及论证习惯的惰性滞后,最终以学术使命危机呈现而陷定量研究者于危地。