楼主: 一品小猪
3323 3

[学术治理与讨论] 走出定量社会学双重危机 [推广有奖]

  • 7关注
  • 29粉丝

学术权威

38%

还不是VIP/贵宾

-

威望
2
论坛币
32331 个
通用积分
78.3614
学术水平
193 点
热心指数
241 点
信用等级
180 点
经验
78822 点
帖子
2755
精华
0
在线时间
4778 小时
注册时间
2009-6-11
最后登录
2024-4-19

初级热心勋章 初级信用勋章

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
走出定量社会学双重危机

陈云松
摘要



定量社会学研究已不再满足于数据描述和限于浅表的关联分析,而是开始真正承担起解释、预测社会实质的学科使命。近十年来,我国定量社会学发展迅速,但也遭遇了双重危机——基于内生性问题的因果逻辑危机和基于时空问题的理论视野危机。双重危机交织在一起形成了目前定量研究的四“多”四“难”:多基于截面数据,难以进行因果推断;多囿于个体层面,难以进行宏观检验;多忽视濡染机制,难以进行空间分析;多限于当代调查,难以进行大历史研究。走出双重危机有“五大取径”,即追踪时间差异、培育实验思维、关注濡染机制、构建宏观测量和再建理论思维,定量社会学研究新范式可以在四个方面实现新的突破,即研究论据复合化、检验方法复制化、呈现方式精炼化、研究目标科学化。
关键词:定量研究  定量社会学  量化分析  因果分析  时空分析
一、导言

定量社会学,即以数据为基础,以统计方法为手段对社会结构、过程和现象等进行证实或证伪的社会科学。定量社会学自发轫以来,以其数据的代表性、模型的规范性和统计规律的客观性,在很短时间里就激荡起巨大的学科回馈,并迅速积累起蒸蒸日上的学术声望与地位。尽管人类社会现象较之物理、生物等自然科学现象远为复杂多元,尽管量化方法和其他任何一种研究方法一样具有自身的局限性,但以数据方式对人类社会的实质进行观测、描述与解析,是对人文社科领域研究传统的思辨模式和个案模式的重要补充,更是一场激动人心的时代革命。毫无疑问,无论是在西方还是在中国,无论是经济学、社会学还是政治学,甚至历史学,定量研究的思维和应用,已经成为当代人文社科最具活力、最有潜力和最有利于形成公共学术智业的前沿。



从定量社会学的发展来看,自上世纪80年代以来,基于社会调查问卷数据,使用经典的线性或非线性计量模型(诸如OLS、Logit、多元或序次Logit等)进行变量关联的参数估算,一直是占据主导的研究手段。由于这些经典模型既简约、规范,又能通过多元变量的控制模式充分考量复杂多元的人类社会现象,它们迄今仍是社会学期刊、著作等主流学术阵地中最常见的分析武器。不过,随着社会学家数据搜集渠道和研究视野的不断拓展,以及发展与使用高级模型能力的快速提升,定量研究者已不再满足于早期的数据描述和限于浅表的关联分析,而是逐步开始承担起解释社会和预测社会的学科使命。


定量社会学研究者对于该使命应具有一种当仁不让的勇气与担当,这是因为,在传统思辨研究和个案分析占据主导的社会学草创时代,人类对社会现象和过程的理解,往往依赖于少数社会学家特别是理论家、田野工作者的直觉和体悟。而在今天,随着理论空间的进一步逼仄,传统理论研究者深陷概念的同义反复陷阱,面临把理论研究或降格为理论史钩沉、或引向本学科无力驾驭的哲、史、艺术等学科边缘的局面;而扎根于社会个案的质性研究者,自始至终受制于个案局限的解释无力感。唯有定量社会学,可以起步、受益并深深根植于社会学传统的理论和质性研究,合理地运用数据和统计铁律来真正实现社会学人解释过去、预判未来的学科使命。面对传统思辨研究与生俱来的个人克里斯玛,面对质性研究因深耕现实而收获的田野传奇,当代定量社会学者必须做出一种自我牺牲,放弃研究方法本身对于学者个人魅力的光环,坚持不以方法论上的不食周粟为荣光,背负起不再以情怀为研究至高追求的精神十字架。


对于中国社会学家而言,要真正承担这一使命,靠的不仅仅是一代社会学人在方法视野上的移形换步和少数极优秀学者能攀登到的学术高峰,而应该是整个学科阵营在理论视野、田野精神、科学素养和分析工具的全面现代化。对于定量学者而言,这首先要求所定量分析必须达成积累、形成脉络、养成与国际学界对话的自信与视域。幸运的是,中国定量社会学研究的后发优势,使得我们并没有落在这一时代使命之后。以《社会学研究》为例,其创刊30年以来,量化研究一以贯之保持了相当的强势(图1)。实际上,在改革开放后重建中国社会学的第一个十年,定量研究就已占《社会学研究》同期论文总量的23.8%。在经过第二个十年的盘整和微调之后,定量研究在第三个十年迅速攀升至26.5%。这一比例,虽仍不及国际顶级期刊,但若考量述评、书评类文章的份额,量化论文的比例实际还会更高。更重要的是,大数据研究表明,量化分析领域的杰出华人代表,其全球知名度已经可以和当代国际社会学诸多大家并驾齐驱。这一系列事实,充分体现了立足中国数据、发微中国国情的定量社会学研究,不仅已经具备了与国际顶尖同行对话的格局、高度和底气,更率先走在了建设中国特色、中国风格和中国气派社会学研究的最前列。

更为可喜的是,近十年来,中国定量社会学的方法进步令人瞩目。特别是,探索多元融合的定性定量混合研究方法,致力于解决估算偏误问题的工具变量、固定效应、倾向值匹配等分析手段,以及以大数据、仿真建模、量化历史为代表的新领域和新路径不断涌现。这使得中国定量社会学研究,已经从20世纪80年代的学步、90年代的追赶,在21世纪初转入与全球社会学研究前沿进行对话的历史新阶段。不过,恰恰因为定量方法的方兴未艾,在这个重要历史关隘,对我国定量社会学尤其是方法发展近十年的重要过程特别是方法危机进行回顾、反思和梳理,对加深定量研究历史使命和目标的理解将有裨益。较之欧美等西方社会,中国社会身处改革、转型的洪流,在诸多维度具有更为多元、复杂和微妙的结构过程特征,更需要社会学研究者在扎实和富有想象力的理论思维之上,发微统计原理,精通科学手段,直面学术瓶颈,走出研究危机,以此来正式告别纯思辨、纯个案的社会学手工作坊研究时代。

二、交织的双重危机

在21世纪,对定量分析的抽样代表性问题、数据可信度问题、模型适用性等等的传统批评,都已成为昨日黄花:随着数据搜集能力的不断强化和计量模型技术的不断提高,这类议题都已得到理论和学科实践上的合理解决,不再成为针对定量研究的的批评热点。换言之,以往对定量研究的批评,基本是对早期不成熟、不规范的量化研究的反思。而在今天,从数据质量、计量方法和研究设计的专业角度,从事理论或质性研究的学者阵营,已基本无力对定量研究进行具有真正学术对话意义的批判。但定量研究者决不可因此而沾沾自喜。这是因为,定量研究虽可暂时搁置为人文精神家园添砖加瓦的历史担当,但对社会实质现象进行具有因果逻辑的分析推断,对宏观社会结构进行大历史、大时空的科学解读和预判,乃是定量学者不可推脱的时代使命。而中国定量社会学人在这一使命面前,仍然没有做好充分的历史准备。特别是,质性学者所习得的抽丝剥茧的逻辑精神,理论学者所习得的宏大理论视野,是定量研究者超越畛域之见,迎接学科使命担当的必修课,是真正实现社会学现代化的不二法门。实际上,新世纪以来,在高歌猛进之际,中国社会学定量研究也逐渐面临交织往复的双重危机。

(一)因果逻辑危机:内生性问题的困扰

无论是诠释还是预测,社会学定量研究的终极价值均立足于因果分析。然而,当涉及证明某个“因”会带来一定的“果”,给予调查数据的社会科学研究就必须面对一个永恒的挑战——“内生性”(Endogeneity)问题。此问题一言以蔽之:由于总有某种无法观测的个人能力或者异质性的存在,基于观测数据的定量研究,其单方程经典回归模型系数统计显著与否,本质上只能说明该对变量在统计上是否具有关联,至于孰因孰果,以及这一关系的真正体量,却因偏误重重而无力推断。此间最经典的比喻莫过于打雷和下雨:雷电与雨水的统计关联显而易见,但雷恰恰不是雨之因。从模型角度,广义的内生性问题除前述的遗漏偏误之外,还有自选择偏误、样本选择偏误和联立性偏误等诸多来源。这一核心问题,尽管谢宇等国际华人学者早在20世纪90年代就已有关注,但囿于当时国内外学术交流和定量研究进展的差异,并未获得国内学界的关注。

直到进入21世纪的第二个十年,才有大陆学者在社会学期刊中正式就内生性问题进行系统阐述。尽管量化分析方法发展迅速, 但我国社会学定量研究总体上对内生性问题认识不足,且囿于研究设计、数据质量和模型设置,仍停留在简单统计回归的验证关联阶段,缺乏基于因果推断的解释能力。

公允执论,对内生性问题的漠视,并非仅仅是中国社会学界的危机。在国际定量社会学研究文献中,该问题也只是在21世纪初期才获得全面的警醒。其间,较为著名的就是美国学者莫维(Mouw Ted)在2003和2006年对社会资本研究内生性问题的实证研究和方法梳理回顾。莫维提出,无法观测的个人的能力、性格甚至人以类聚的社会关系特征,也即模型中的遗漏变量(Omitted variable),可能才是社会网(如关系)看似有用的真正原因。这意味着,社会关系本身只是人与人之间选择性的“果”,而不是真正影响求职求学的“因”。莫维这一质疑,基于高级计量模型,直接对以林南和边燕杰为代表的社会网、社会资本学派构成了强大的挑战。此后双方辩论长达十年,皆因彼此阵营对内生性问题本质的认识存在差异而迟迟未能终结,直到2016年新的实证研究问世后才初步达成共识。

除了社会网和社会资本研究之外,在中国社会学定量分析的其他领域,内生性问题还远远没有像经济学、教育学等领域那样得到足够的重视。本质上,解决内生性最简单直接的方法就是对社会分析对象进行自然实验。然而,和心理学、生物学和医学实验不同,社会实验受到研究伦理的极大限制,因此几乎注定无法成为社会科学研究的主导方法。也因此,只要基于问卷调查数据的定量研究长期存在,内生性问题就会是一个永远悬挂于社会学定量学者头顶的达摩克里斯之剑。基于问卷数据的定量研究者,在内生性问题的威慑之下,也就必须始终依赖高级计量模型和具有足够信息量的数据,才能对社会过程和现象进行真正有说服力的分析解读。

从学科内部结构的角度,内生性问题足以对定量社会学带来重大危机,乃是因为:如果定量社会学家无法为社会过程提供具有因果逻辑的证据,就会丧失其在学科维度的发展优势。简言之,思辨研究者,凭借学者的抽象思维能力和学力积淀,可以对社会的过去、现在和未来进行充满才华的描述、解读和诠释。尽管这种解读不一定有数据和实证的基础,但听众们对于思辨研究、田野研究的期许,恰恰是情怀、直觉、充满艺术感的语焉不详或充满现场感的事无巨细,而未必会把严密的因果逻辑和统计证据作为对治学者的要求。但定量研究者的听众则大相径庭:他们往往更以因果链条和统计可靠性作为衡量研究结果的重要甚至唯一的准绳。也因此,失去因果推断,对于思辨型学者,可能只是失去了枷锁。但对于定量学者,失去了的是刀的刃、箭的簇、枪的尖,失去的是自身学术的价值基础。

(二)理论视野危机:研究时空的窄化与滞后

理论的缺位,或者说对理论的淡化,是中国当代定量社会学研究遭受传统思辨研究者批评的重要方面。理论化的不足,对于定量社会学来说,实际上是一种视野的不足,而非方法的不足:起码在中国的定量社会学人,几乎没有一位不是从传统的思辨和理论训练体系中成长和走出的。翻出中国定量社会学者在学术生涯早期阶段的理论作品,其分量绝不比其他任何领域的社会学者来得轻。那么,为何定量社会学作品往往显得无趣、缺乏理论的锐度和吸引力?

社会科学研究的基本原理之一,乃是社会情境,即群体差异性的模式会随社会情境的变化而变化。而时间和空间,或者说时空,恰恰是界定社会情境的重要维度。从三十年国际国内定量社会学发展的轨迹来看,传统分析层次通常为问卷调查的个体。然而,大量的社会关系和社会过程,如社会制度、法律、文化等,都是宏观层面的社会属性并非个人属性,也往往无法通过基于个体层次的微观分析而得到观测和分析:唯有具有大时空视野,才能提出这类问题、分析和解答这类问题。受限于传统的调查研究数据、学科模式的谨小慎微(诸如对“生态谬误”的恐惧),定量学者们三十年来纷纷习惯于对个体样本数据的观测研究,这种研究视野的窄化,非但让定量社会学研究的领域和对象不断固化、矮化,让学科成果在社会大众面前显得琐碎而了无趣味,更容易让定量学人不再对宏观社会现象具有理论使命感,甚至走向自我封闭的道路,以沉默的大多数心态,来消极看待思辨型学者对历史现象、大跨度空间社会现象进行多度的个人化解读,放弃自身作为学者对社会思潮的历史担当与责任。尽管定量学人在从事社会学研究之初,往往都具有良好的理论基础和质性训练,但随着量化研究的不断重复、积累,随着个体调查数据分析思维模式的深入骨髓,反而逐渐变得漠视和淡忘理论,这使得本可以一举超越传统理论研究和质性研究的历史机遇,在一定程度上未能被及时把握。

同样重要的,较之书斋中的思辨和田野间的访谈,定量研究必须依赖于高质量的数据生产。而获得高质量的数据,耗时既长,人力物力投入也往往非学者个人所能及。因此,数据作为分析工具的天然滞后,必然导致了一种学术过程的后撤:对于现实具体重大社会变迁的把握和重大问题的发现,思辨研究的理论家和田野研究的发现者,似乎总能走在历史的潮头,走在定量学者的时间前方。也恰恰因此,甚至有学者认为,理论和定性研究,是定量分析的基础。当失去了研究的历史先机,当获得“发现者”、“首倡者”这类荣誉的概率略低,定量研究者们也就自然容易满足于对既有理论的证实证伪,甚至滑向依托现存数据和问卷,闭门造车做模型、纯为发表而写作等等误区。这样,和理论家容易滑向过度制造概念、质性研究者容易滑向过度解读如出一辙,分析工具层面的时滞问题,一个纯粹技术的问题,逐渐发展、积累成为定量学者群体中更容易出现的自我复制、自我陶醉的旨趣问题。

因此,视野的危机,其实不是人的危机,不是学力高低的危机。作为定量社会学面临的方法危机,它最初来自于数据层面的过度微观化和生产滞后性,并逐渐发展成为一种分析时空、理论视野的窄化,以及论证习惯的惰性滞后,最终以学术使命危机呈现而陷定量研究者于危地。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


已有 1 人评分经验 收起 理由
remlus + 100 精彩帖子

总评分: 经验 + 100   查看全部评分

沙发
一品小猪 发表于 2017-10-23 09:30:42 |只看作者 |坛友微信交流群
不论是内生性问题还是时空问题,两者并非独立存在。当其交织在一起时,在数据、假说等定量研究具体的维度中,表现为四“多”四“难”:

第一、研究多基于截面数据,难以进行因果推断

目前的社会学定量研究通常是基于以年为单位的截面数据。而基于截面数据探寻因果机制会非常地捉襟见肘。在传统的遗漏变量解决方案中,学者们会尽力利用截面数据中的非传统数据作为遗漏变量的替代(proxy)并加以控制。假设我们要估计本科专业对大学生毕业收入期望的影响,本科专业的选择并非外生,比如,选择什么专业可能与学生本身的学习能力有关,而学习能力又是收入期望的重要预测变量,如若无法控制能力和就无法准确估计专业选择的影响。但能力往往不易观测。即便我们用高考成绩单代替能力,但实际上,任何一个模型的遗漏变量,都不可能通过穷举方式实现。这是因为,在逻辑的角度,我们无法知道遗漏了哪些未观测到的、且与我们感兴趣的自变量相关的因素,从而使得分析结果产生内生性偏误----总有我们想不到的遗漏变量成为内生性问题的来源。此外,双向因果问题也是困扰截面数据的重要话题。就该例而言,即便我们可以观察到本科专业与首职收入期望存在相关,然而这种相关关系的存在既可能是进入该专业后,学生对专业的发展有了更多的了解后而做出的未来收入估计,也可能是报考专业前个体对收入存在期望进而影响了个体的专业选择。因此,在不使用工具变量(Instrumental Variable)的情况下,仅仅基于截面数据的研究,内生性问题难以厘清,因果关系难以判断。但工具变量的寻找极为困难:要寻找到一个与解释变量高度相关,却与被解释变量无关的要素,不啻寻找传说中的圣杯。

第二、研究多囿于个体层面,难以进行宏观检验

在社会科学研究领域,按照需要被解释的因变量Y和作为主解释变量的自变量X所在的社会结构层级,我们可以将相关研究划分为四个层次,“微观定量社会学”(X和Y都在个体层次)、“中层定量社会学”(X在群体层次,Y在个体层次)、“中层定量社会学跃迁分析“(X在个体层次,Y在群体层次)与“宏观定量社会学”(X和Y都在群体层次)。前两种层次的定量社会学分析,是当代社会学领域的主流研究范式,其面临的主要危机乃是前文提及的内生性问题,但可以通过更高质量和信息量的数据以及更合适的高级计量模型加以解决。第三个层次的跃迁问题,试图回答群体现象可以从个体选择中涌现产生,这是社会科学研究的难点,虽然无法直接用传统的模型拟合方式解决,却可以通过实证校准的仿真建模(如多主体仿真)来进行探索。第四个层次的“宏观定量社会学”,受制于研究视野的窄化,相较于前三类层次的研究,出现了明显的滞后。

缺乏对宏观数据的关注,使得定量研究呈现出三个方面的缺憾。首先,个体数据不利于理论发展。由于社会学家不像经济学家那样具有记录良好的大时间、大空间数据(如省级、市级的历年统计数据),这就使得宏大理论难以通过传统数据来得到经验验证。其次,个体数据无法进行大跨度的纵贯分析。从方法上看,社会学定量分析方法已经越来越接近微观经济学,多基于个体问卷调查对象的截面数据和短面板数据,而宏观经济学中使用的来自省市甚至全球的行政区域历年统计数据等等,都构成了信息量非常丰富的时间序列数据、长面板数据,可以对大历史跨度的现象进行追踪分析。最后,个体数据难以助推理论的跃迁。从“生态谬误”(即将基于宏观群体层级的结论运用于推断个体行为之上)的角度,严谨的定量分析者,应该对任何一种理论都进行个体和群体两个层次的检验。由于目前定量社会学研究被局限于个体调查数据,因此一切复制性和拓展性研究,只能考虑在原始数据或同样的个体数据中进行,无法探索在宏观层面上进行复制性研究的可能。

第三、研究多忽视濡染机制,难以进行空间分析


在理解真实世界时,空间濡染机制是相当多社会问题中必不可少的一环。这是因为,很多现实现象具有明显的空间相关性,即濡染机制(第一地理定律):相似的事情在地理空间上也是彼此接近的,或者说社会现象会出现地理空间上的扩散濡染。但恰恰由于缺乏空间思维训练,缺乏地理空间数据以及相应的分析技术,定量社会学界长期以来对这一机制的关注颇为有限。随着包含地理信息的调查数据日益增多,空间分析的可用性也不断增长,将空间纳入研究框架对社会科学研究大有裨益。对于社会学家而言,也许空间分布本身并不具吸引力,但是空间分布如何影响个体社会关系,进而影响个体劳动力市场不平等却是社会学家所关注的重心。比如,一项关于贫困的研究发现,对于同样接受福利救济的人,居住在离工作机会集中地越近的人找到工作的概率越大,实现脱贫的速度越快。实际上,在定量分析的模型回归中,如若忽略了确实存在的空间相关性、传染性,都有可能导致模型设定偏误,从而低估模型系数的标准差或者标准误。这个问题,即便基于大样本进行分析,也仍旧无法消除。以城市研究为例,将空间因素纳入分析模型,并形成较为成熟的研究范式的学术团体,主要是经济学家、地理学家,而社会学家则还是这个领域的新手。如果能厘清空间分布、空间形态,社会学家将会对更多社会议题(如,我国快速城市化大背景下所产生的人口迁移、居住隔离、犯罪、环境等问题)及政策的制定获得更大的发言权。

第四、研究多限于当代调查,难以进行大历史研究

“调查革命”出现后的几十年,传统调查问卷技术迅速发展,以问卷调查数据为主要研究对象的微观定量社会学研究突飞猛进,但是,再大的样本,仍然不是全部总体;再长的追踪期,难以超越数代人的历程。在定量社会学研究发展时间较短的国内,可用的数据来源本来就十分稀缺,比如CGSS从2003年开始启动调查,到目前一共发布了两个阶段近十期调查,已是我国问卷调查追踪数据积累最早的高质量数据库之一。但是由于两个调查阶段改变了调研地,亦不对外披露数据的地理位置信息,一旦涉及空间问题,往往让学者束手无策。更重要的是,要解答大历史、大空间的宏观社会学问题,目前基于当代、基于现世的调查问卷是远远不够的。例如,如果我们要回答,建国以来,中国公众对社会结构分层的关注有什么特征和变化?或者要回答,上世纪一百年以来,美国社会的阶级阶层意识是如何演变,定量研究者就会面临无米之炊的困局。而这,恰恰不妨碍思辨型研究依赖非常少的史料和个人的体悟进行有趣的分析。所幸的是,大数据应运而生,或将为解决类似问题提供新的机遇。这是因为,大数据本身,是可以超越当代、超越现世的数据记录,是时空跨越程度极大的分析对象来源。

三、走出危机的五大取径

针对当前定量社会学的双重危机与交织其中的四个不足,学界已经开始积极反思。从方法角度,笔者梳理出五个方面相对前沿并值得当前中国社会学定量研究者高度关注的取径。



(一)追踪时间差异:时间序列和面板分析


面对截面数据难以进行因果推断的缺陷,在数据允许的情况下,通过时间序列分析或面板分析来追踪时间变化所带来的差异性影响,在一定程度上可以弥补这一不足。相比截面数据分析,时间序列分析往往是基于单个个体分析其随时间的变化状态,而面板分析的数据综合了截面数据和时间序列数据,是对不同个体随时间变化状态的分析。时间序列分析与面板数据对于解决内生性问题的优势在于,均可做到对同一个体进行追踪以得到个体随时间变化的趋势与规律。如果内生性问题主要来源于个体不随时间变化的不可观测或不可测量因素,或即便某些不可观测或者不可测量因素随时间变化,我们就可以基于时间序列的结构特征,通过历年模型的差分方法,将这些时间固定的干扰项排除在模型之外。


在一个有关同群效应研究中,哈努谢克等学者利用Texas学校的面板数据估计了同群效应对个体成绩变化的影响。为准确反映同群效应,作者在研究中控制了个体、学校、年级及学校的固定效应,结果发现,同群的平均成绩对个体成绩的提高有正向影响。需提及的是,通过历年模型的差分方法仅可以消除不随时间变化的非观测因素,然而却无法控制随时间变化的非观测因素。如果在这种固定效应分析的基础上进一步增加识别信息,例如工具变量,或者动态面板分析,则能更好地得到可靠的结论。此外,时间序列和面板分析不仅适用于个体层面的追踪数据,更适用于群体层面的数据。正如宏观经济学研究那样,社会学定量研究者完全可以利用多国、全国各省市的各类统计年鉴资料,结合历年积累的具有省市样本代表性的加总社会学数据,进行匹配后形成群体层次的时间序列或者面板数据,进行关联分析研究。


(二)培育实验思维:工具变量、双重差分法与断点回归


实验思维是解决内生性问题的有力工具,而其中的随机试验又是识别因果的最优选择。然而,随机试验成本高昂,常因涉及伦理道德问题而难以实施,这时候就需要选择一些次优的因果识别方法,其中贯穿体现了实验或者准实验的思维。其中较为重要和前沿的,则是工具变量、双重差分与断点回归方法。
国内社会学界对工具变量(Instrumental variable)并不陌生。所谓工具变量方法,就是引入一个外生变量Z, Z必须满足与自变量X相关但与因变量Y 不直接相关的条件。因为Z是完全外生的,只能通过影响X而间接影响Y。由此,如果X和Y有因果关系,那么Z对X的冲击一定会传导到Y上。借用这个逻辑,我们就能推断出X和Y之间存在因果关系。因为外生的Z往往来自自然天象或者社会实验,因此工具变量本身也体现了随机实验的思维。比如,要验证村庄网络与农民收入的因果关系,可以使用村庄内自然灾害作为村庄外出打工人数的工具变量,理由是自然灾害会降低村庄对全年收入的预期,从而增加外出打工的可能性,且灾害强度越大,遭受灾害的村庄外出打工人数就会越多。不过,虽然工具变量方法简洁强大,但其外生性无法进行统计检验,也非常难以寻找。也恰恰如此,工具变量研究总会面临挑剔者的追问。


近几年,双重差分法(difference-in-difference,DID)已经在国内经济学领域得到推广和应用。双重差分法的想法最早是在19世纪伦敦霍乱流行期间由约翰·斯诺(John Snow)医生提出。当时普遍认为霍乱流行的罪魁祸首是被污染的空气,而斯诺却认为被污染的饮用水才是霍乱传播的主要途径。为验证这个想法,斯诺比较了当地两家饮用水公司所对应的霍乱地区的死亡率变化,结果发现,相比饮用了A公司提供的饮用水的地区,饮用B公司提供的饮用水的地区死亡率显著较低,究其原因,A公司发现水源被污染后将传输所用的水泵搬离了受污染的区域,而B没有,就此证实了饮用水污染是霍乱流行元凶的想法。可见,双重差分法的使用是基于自然实验的思想,通常是利用一个干预(treatment,也即一个二元变量X)所带来的横向单位(干预组和控制组之间)和时间序列 (干预前和干预后)的双重差异来识别X的“处理效应”(treatment effect)。运用双重差分法要求掌握样本的前后两期数据,其本质也是一个二期的面板数据。其实,早在20世纪90年代,该方法已经被西方计量经济学界及社会学界广泛应用,只是在中国定量学界中运用较晚。2005年,周黎安与陈烨首次将双重差分法的思路应用于经济学研究中。不过,该方法在中国定量社会学研究中仍旧很少。


断点回归(Regression Discontinuity)也是一种拟随机实验方法,其基本思想是,个体被分配到不同组(干预组和控制组)通常是基于某个预先计划的临界分数,在该临界分数变化前后较小的区间内(意味着我们所比较的群体具有较高的同质性),我们可以比较对于某个项目,最需要或最应该进入该项目的群体在参加与不参加该项目上获得的差异。具体而言,断点设计将X定义为一个或几个变量的间断函数。也即,存在一个因素,当其大于临界值时,个体进入干预组,反之则处于控制组(例如高考成绩,高于分数线,就成为大学生,低于分数线,就成为落榜生)。在断点回归中,我们利用临界值附近样本的系统性变化来识别因果效应。 Douglas Almond等经济学家2009年发表在《美国经济学评论》上的文章,是有关中国的研究中第一篇使用断点回归分析的文章:他们以淮河与秦岭构成的中国南北分界线作为临界值,研究了中国供暖政策对空气污染的影响。


(三)关注濡染机制:空间分析模型


在社会科学研究中,空间分析一直占有非常重要的地位。比如城市社会学中少数群体的居住隔离与聚居、城市贫困与贫民区、城市内的居住迁移模式等众多重要议题一直与空间分析密不可分。再如,社会学视角下的社会网络,不仅体现在个体之间的关系网络上,还呈现出高度的空间相关性,因此在分析中既应该有基于个体的社会网分析,也应该有基于区域的空间濡染机制的分析。此外,进行空间分析,还可以借助地理信息系统GIS的表现力,将大量信息压缩在一幅图中展现,使得枯燥的数据更加生动,让一些埋没在海量数字中的规律得以更加直观地浮现出来。不过,受数据和分析技术所限,在国内社会学的相关研究领域中,有关空间分析的概念一直付诸阙如。


目前,空间分析中应用最为广泛的模型为空间滞后模型与空间误差模型,其原理并不复杂。例如,空间滞后模型就是在传统OLS模型中嵌入滞后因变量(周边)的延伸模型。比如,GDP高的地区,其周围地区的平均GDP也会比较高。其模型可以写作。其中,其中,表示因变量Y的空间滞后项WY对因变量的影响效果。W实际是一个地理邻接或者距离矩阵。而如果假设空间相关是一种统计干扰,则模型为空间误差模型,也即,其中表示相邻观测值的空间误差项的相关程度。 真正的社会科学研究中,很多现实现象都或多或少具有空间相关性。换句话说,空间相关在传统社会科学研究中可能是一个重要的遗漏变量,如若置之不理,非但不能观测到社会现象是否具有濡染现象,而且还会对标准回归模型产生不可靠的偏误结论。


(四)构建宏观测量:借助大数据


大数据的出现和发展为定量社会学者研究大历史、大空间的宏观社会过程提供了全新的前景。对于社会学而言,目前可用的大数据主要包括数量级以千亿词汇、万亿字节的数字化书籍、媒体、语料库、视频库、互联网文本、搜索引擎记录以及脸书、微博、微信等当代自媒体平台。数年前,哈佛大学的加里·金就预言,随着大数据的出现和使用,整个社会科学研究的实证基础将会出现重大变化,研究问题的广度将伴随着海量数据的整合而得到极大拓展,甚至会加速定性与定量研究的大融合。


实际上,利用大数据来进行人文社科领域的量化研究,已经逐渐成为相关学科的前沿和热门领域。对于跨度百年甚至数百年的知名度、文化影响力、阶级意识等抽象概念的宏观分析,往往局限于文字描述和有限的史料记录,而图书和互联网大数据的出现为构建这些概念的具体指标提供了可能,使得研究成果具有大视野、大跨度的特征,具备高度的科学性和说服力。例如,在最新的国际研究中,学者利用谷歌百万图书语料库,对美国社会整个20世纪一百年间的阶层关注度与通货膨胀、就业率、基尼系数等指标进行了时间序列分析,发现了宏观经济指标与社会公众的阶层话语之间的统计关联,为社会分层文献提供新的宏观层次美国案例。再如,基于同样的书籍数据以及新浪微博、百度指数等大数据,学者们已经对中国城市国际知名度获得的模式、社会学史、网络舆情与股市、网络新生词汇等进行了饶有兴味的时间序列和面板数据分析。


(五)再建理论思维:重读人文经典


重读典籍,本身看似不是一种适用于定量社会学研究的路径。但对于习惯于从数据发掘规律,从结果验证理论的定量学人而言,重读人文经典书籍,可以带来四个方面的重要拓展,为理论思维的重建形成学力和思维模式的保证。第一,重读社会学经典概念,可以从中获得理论研究的定量分析对象。例如,有学者对韦伯的新教伦理与资本主义的理论进行了实证分析,发现了数据并不支持韦伯的理论。此外,除了大师的经典作品,对当代人文学者提出的各类重要理论,都有进行检验的学术空间和必要。例如,针对周晓虹提出的“文化反哺”理论,有学者进行了互联网特别是自媒体时代的理论拓展,并提出“代内文化反授”的新概念,且用采集自互联网的数据进行了量化分析④。这实际上是一种量化和理论的混合研究:基于原有理论,再进一步从社会现象中提炼、发现和提出新理论,然后用数据进行定量验证分析。第二,重读中外历史,可以从中获得重要的社会科学数据来源。例如,基于历史资料的人哈佛大学CBDB历史文化名人数据库,为定量历史研究提供了非常宝贵的资料。而各类文化词典、辞书、方志等资料,也足以成为对文化历史现象进行分析的重要数据来源,甚至提供新的社会学分析思考的灵感来源。第三,重读文化经典,可以让定量分析者作品的文采和感染力进一步增强,改变定量文章因为本身结构化特征给读者带来的枯燥感。甚至,从弘扬中国传统文化的角度,不妨尝试利用文言文进行定量论文创作,探索形成既文采飞扬,又有扎实数据基础的具有中华文化特色的社会科学论文“第三条道路”。第四,重读通识经典,走出社会学经典,对文史哲艺术等门类进行全科通识阅读,有助于帮助定量研究者重新熟悉自己踏入社会学领域之初所获得的理论训练和青少年时代的通识阅读。当这种重温建立于扎实的定量方法训练之上时,定量学人会获得重要的意外收获:从基础理论和基础通识走入社会学的门厅,从定量方法进入社会学的堂奥,最终实现人文、理论、科学和数量的有机结合,获得高屋建瓴的视域和眼界。只有这样,定量研究才能始终置于通识的人文熏陶之中。这一代定量学人也才能真正告别那种把自己封闭在数据空间中的传统定量分析模式,让人文和情怀为定量研究插上翅膀,真正成为让所有学者服膺的主导研究方法。



使用道具

藤椅
一品小猪 发表于 2017-10-23 09:31:02 |只看作者 |坛友微信交流群
四、定量社会学研究范式前瞻

要走出双重危机,除了前文提及的模型方法和数据的进一步优化,在研究范式上,定量学人也应该有发展和突破,以为获得因果逻辑解释和为大历史、大空间分析提供更具有说服力的证据,担当起学科使命。



(一)研究论据复合化:一变量多测量、一假说多模型、一模型多数据


笔者认为,研究手段复合化的方法将更加普遍地用于增加文章可信度。也即,在一篇文章中通过多种测量、多种模型、多种数据证明同一个假说,以此提高定量社会学研究结论稳健性。其中,一个变量多个测量一个假说多个模型,已经得到不少应用。此外,一个模型多个数据,也得到了初步但有益的实践。例如,2015-2016《社会学研究》和《社会》两大刊物论文中,复合数据的使用开始明显增多:从数据数量上看,使用两三个甚至四个以上数据的论文已经占到9%。其中,《社会学研究》的平均数据使用量为1.58个/篇,《社会》为1.30个/篇;从发表年份看,2015年每篇论文的数据使用量是1.40个/篇,2016年上升为1.44个/篇。具体来看,既有运用多个调查数据库对统计结果进行平行检定,也有学者针对某一时期/地区宏观变量对实证分析可能的“干扰”,将若干截面数据合并生成新数据集。


(二)检验方法复制化:走向开源、可复制的社会学


随着定量分析方法逐渐成为当代社会学研究的主流手段,用来验证研究成果的学术透明化的开源机制——复制性研究呼之欲出。在定量分析中,复制性研究是利用已有研究成果的数据和估算相关模型所用的计算机程序代码,对其研究的全过程进行再现,达到校验(即使用相同数据相同模型)和拓展(使用相同数据不同模型或者不同数据相同模型)该项研究的目的。因此,复制性研究是将社会学引向规范化的重要手段,也是未来定量研究的必然趋势。已有学者在国内社会学学界进行了相关的倡导工作,并提出其必要性的六个方面:第一,社会学研究成果是集体事业的公共产品。第二,定量分析的简化模型理应提供校验以增加可信度。第三,内生性等问题需要对既往分析进行拓展检验。第四,其他社科领域成功复制比率偏低值得警觉。第五,有助于加强研究方法教学与训练。第六,有助于中国社会学形成后发性优势。


(三)呈现方式精炼化:提倡结构化、集约化、可视化、多元化


不同于社会科学,自然科学论文相对篇幅较短,文献回溯部分不作过多着墨。其结构亦明晰清楚,甚至用提纲挈领的导言、背景、方法、数据、结果等直接加以标注。其结果的呈现方式,也不仅仅局限于定量社会学的表格和长篇大论,而往往通过可视化图形以替代长篇文字来梳理研究脉络。因此,借鉴自然科学研究成果的展陈方式,定量社会学研究也应提倡如下三个方面的精炼化:第一,结构科学化,形成明晰的逻辑模板,提倡科学的“八股”。好的科学研究,理论之美,不一定需要文辞修饰来体现。第二,适当压缩文献回溯提炼,倡导集约化的文献和理论部分文字,避免对海量文献的过量铺陈和装饰。第三,多利用可视化的图形来表现文章信息。期刊应该更多尝试和鼓励彩色图表、动画展示和视频结果。即便在印刷本无法呈现,也可以通过在线下载的形式,把社会学定量分析的成果用最生动的形式展现出来。第四,由于社会科学又具有人文属性,因此,定量社会学的论文展示还应该多元化。前文提及的,利用文言文进行定量研究的创作,使得定量论文本身成为美轮美奂、充满艺术美感的作品,就是一种有益的探索。


(四)研究目标科学化:重返描述,告别关联,解决因果,走向预测


一段时间以来,社会学定量研究似乎开始把描述性研究视为“低层次”成果,但凡不进行回归分析似乎就不是定量分析。而这种趋势导致了一个“描述悖论”:重要的社会现象和社会问题虽然众说纷纭,但仍然很少被清楚的描述清楚。而好的描述本身,能在因果和预测之前,对基本的基本社会现象、社会事实、社会问题进行全景和细致的描述。没有好的描述,因果和预测就是无本之木。这一点,尤其应该引起定量社会学重要学术期刊的高度重视:对于重大社会议题,应该鼓励利用质量优秀、来源新颖、代表性强的数据进行的描述性研究。


在描述清晰的基础上,社会学家当然普遍认同因果机制在理论建设中的重要性。在理论建设过程中,尤其是社会科学的理论经常是基于移情作用的事后解释,而对理论的评价往往是基于这些理论是否能对观察到的行为赋予意义。我们常见的理性行动理论就是典型的例子,行为理论看起来是科学的,但实际上十分依赖于事后人们对行为的理性化。思辨式研究阵营中,社会学理论构建并不对预测提出明确的要求,但定量研究阵营必须把这一历史使命勇敢地承担起来。因为,事前预测行为,需要扎实的统计和实证基础,而事后合理化他人的行为,只需要个人的奇思妙想。


也因此,著名社会学家,小世界理论的提出者邓肯(Duncan Watts)提倡社会学理论应具备预测性。按照邓肯的观点,如果我们将因果关系、可理解性、预测性这三者之间纠缠的关系厘清,就能发现可理解性或者说可解释性与因果性之间的关系是不完全相容的,甚至是相背离的,因此,我们有时不得不在高可理解性与高科学有效性之间进行选择。而预测性与因果性是一致的,准确地说,预测性是因果性的必要非充分条件,同时也是检验因果机制的重要工具。走向预测,不仅能够促进学科间的融合,同时可以令定量社会学更多利用非常识来建立更加科学有效的理论,这将会是未来社会学分析范式科学化的重要趋势,也是未来定量分析获得社会学领域内更有分量地位的重要途径。

五、结语


海德格尔在《存在与时间》中写道,一门科学在何种程度能够承受其基本概念的危机,这一点规定着这门科学的水平。随着抽样方法的完善,数据质量的提高,高级计量模型的不断发展和应用,蓬勃向上的社会学定量研究似乎一片形势大好。但也恰恰在定量社会学研究崛起的近十年,我们也迎来了学科的双重危机——基于内生性问题的逻辑危机和基于时空问题的理论危机。针对双重危机体现出的四个具体问题,我们进一步提出了走出危机的五大取径,并展望了未来研究范式转型的四个方向。



当然,归根结底,传统定量社会学长于调查,和经济学相比,与其说社会学不使用一些分析方法和模型,不如说,之前社会学缺乏相关的数据,缺乏对相关分析方法和模型的关注使用和发展。从学科差异的角度,大部分的经济学概念可以清晰、简洁、准确的操作化界定,但社会学由于理论和概念的复杂性,在操作化方面往往也难以达到相应的要求。因此,这更需要社会学定量研究与其他学科定量研究的相互学习、借鉴和发展,并重新回到理论层面来思考。而这个理论层面,强调的是,社会学定量发展瓶颈的背后,不仅仅是调查、数据、方法和模型的问题,而是理论发展相对滞后的问题。而对这方面的反思,我们所提出的重读人文经典、拓宽理论视野恐怕仍然不能够根本上解决问题。从这个角度,社会学定量研究面临理论创新这一重大挑战,或许是潜藏在种种危机、瓶颈后的深层问题。


无论如何,当定量社会学的传统方法、手段和范式不能解决这些危机时,我们必须动员起新的方法、新的数据、新的模型、新的范式、新的思维,确保定量学人能够应对这些挑战,走出历史的关口。毫无疑问,新的数据来源和模型设置,必将为社会学定量研究打开新的研究之门,极大丰富定量社会学的研究主题与技术技巧,促进学科持续繁荣发展。与此同时,或许更为重要的,新的研究范式和理论视野也会将社会学定量研究引入新的并且更加合理、科学和严谨的学术规范当中,为学科内部交流与跨学科研究打下良好的基础。而最重要的,或许是定量研究者的心态和思维:作为学科使命的当代承担者主体,我们必须认清历史的使命和学术的社会道义价值,以百倍的努力、信心,以更为宏大的视野和更宽厚的肩膀,来应对历史的挑战,迎接社会学大时代的真正到来。
已有 1 人评分经验 收起 理由
remlus + 100 精彩帖子

总评分: 经验 + 100   查看全部评分

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注ddjd
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 14:30