对于研究者来说,其学术和研究生涯遇到的大多数反馈都是基于语言逻辑 的。比如,在各种学术讨论上、与同行交谈甚至在审稿人意见中,对方一般用 语言的方式陈述作者研究工作中存在的问题: “你的结果高估了真实作用大小”“你的解释变量存在内生性问题” “你的因果关系可能只是相关” “样本也有自 选择问题”等等。这样的语言逻辑和上文提到的常识不同: 使用者为受过专业 训练的社会科学研究人员而非一般公众。在这种情况下,如何将这些回应阐述 成严谨的公式推导对于研究者回应问题、重新研究设计以增加稳健型讨论就非 常重要了。我和香港科技大学社会科学部龚启圣 ( James Kung) 教授合作的工 作论文 Of Maize and Men: The Effect of a New World Crop on Population and Economic Growth in China 在审稿过程中便遇到这样情况。长期以来,马尔萨斯型社会中的 技术进步所造成的经济和社会影响一直为经济史学家和宏观经济学家所关注: 理论模型预期在马尔萨斯时代,技术进步仅会带来人口增加但不会改善长期人 均生活水平。这篇论文试图通过实证检验北美作物玉米在中国引种和拓展对明 清时期人口和经济发展的作用以检验上述理论。玉米由于其抗旱性和对地形的低要求,被广泛种植于清代内陆的新开发地区并显著提高了中国的粮食产量: 1900 年中国粮食生产面积比 1380 年增加 3. 3 倍,对同时期粮食增加的贡献率超 过 55% ( Wang,1973; Perkins,1969) 。学者因此将北美作物在中国的引种和传 播比作是宋代引种占城稻之后的第二次农业技术革命 ( Ho,1959; Lan,2002) 。 实证考察玉米作用需要该作物在中国引种的系统数据。当我在进行这个研究的 时候没有任何一本历史著作系统搜集过这些数据。历史学家仅仅提供了大概引 种趋势: 玉米在 16 世纪中叶被引种到中国,经过 3 个多世纪的拓植,在 20 世 纪初期中国的所有地区均种植了玉米 ( Ho,1959) 。虽然这些研究富有先导性和 启发意义,我们需要的是玉米在中国每个地区的精确引种时间,这无疑是一次 劳动密集型工作。我在博士阶段用了整整两年的时间从明清时期出版的全部 1119 本府志中诸册查找并最终建立了玉米引种的数据库 ( 图 1) 。
这篇工作论文在第一轮审稿中一共获得了 4 个审稿人的 142 条审稿意见,其 中绝大多数都是语言逻辑: 他们仅仅指出初稿中他们认为有问题的地方。如何 用实证方式加以处理则是作者自己的事情。论文最终能否被期刊所录用就取决 于能否令审稿人满意地处理他们的质疑。以下用其中一条意见为例阐述这两种 逻辑之间转化的重要性。
图 1 展示出的这种渐进时空变化使得研究者可以采用标准的双重差分方法 ( Difference in Differences) 来检验其作用,其作用估计结果见图 2:
图 2 的横坐标表示距离该地区玉米引种的时期数 ( Number of Periods since Maize Adoption) ,纵坐标则表示人口密度在引种和没引种地区之间的差异 ( Change in Population Density) 。图中的实线表示人口密度在玉米引种前后的变 化,两条虚线分别为估计系数对应的上下 95% 置信区间。从该图中,我们可以 看到在玉米引种之前,两个地区之间没有显著差异。但在引种之后,引种地区 的人口密度开始超过没有引种玉米的地区。在工作论文里面,该图出现在正式 回归之前作为玉米促进人口增长的描述性证据。其中一个审稿人对此提出质疑: 他注意到在玉米引种前的 3 至 2 期及 1 期到 0 期,引种地区和非引种地区人口的 差别在趋势上同样存在上升趋势。在这种情况下,审稿人认为我们无法排除从 0 到 1 期的人口增长可能是偶然因素所致而非是玉米作用。
在我的理解中,如果 0 至 1 期的正斜率来自于随机效果的话,那么把一个地区的玉米真实引种时间随机赋给另外一个地区然后重新回归依然得到相似效果, 如果真是这样的话,我们就无法再坚持 0 到 1 期的正斜率是玉米的作用了。为 了实现概率上的效果,我们需要重复这样的赋值很多次。图 3 展示该项虚拟工 作获得的玉米引种估计系数的 t 值,三个图依次是进行 5 000 次、10 000 次及 30 000 次随机赋值的结果。从中可以清楚发现,在这种重复实验中,获得 t 值呈现 正态分布: 绝大多数都介于 - 2 和 2 之间。这意味着随机赋值获得的估计系数绝 大多数都不显著。虽然在概率上仍旧可以坚持基于真实赋值获得的 0 到 1 期正 效应还是偶然的。但这种偶然性太低了,低到足以使得我们认为这是不可能的: 该时段的正效用的确由于玉米引种所致。在该论文的第三次审稿中,上述修改 意见最终得到了审稿人的认可。
严谨的因果思维能力是高度训练后养成的自觉。了解文字逻辑对应的数理 逻辑需要研究者接受刻苦的方法论训练。因此,在研究开始之前,系统学习线性代数、概率论及计量经济学的知识是必须的。但实现这两种逻辑之间的转换 对研究者的要求则更高: 坚实的计量经济学基础之外仍需要持之以恒且大量的 学术阅读,以此培养实际应对能力。从这个意义上,求知欲和进取心只是第一 步,除此之外还需要一个好的老师领你入门。我想说的是,KKV1994 正充当这 种教练的角色。对于初学者来说,这本书提供了训练所必要的知识,同时又维 持在一个恰当的难度水平。作者们主要借助浅显易懂的文字逻辑而非抽象复杂 的数理逻辑告诉读者在研究设计中会遇到的问题,造成的后果及相应的对策。 在维持读者信心的同时,循序渐进地揭示出描述性推论及因果推论的相关知识。 KKV1994 的风格使我从没感到方法论很枯燥。恰恰相反,它是我认为最有意思 的一门学问。同时,对于学者来说,这也是一本常读常新的著作。工作以后, 我依然经常抽空翻翻它。书里面的内容不断提醒自己在研究过程中要避免作者 们提到的那些问题。这种互动,正如作者在中文版序言中所写: “本书的信息可 以促进读者重新审视自己的研究,同时在有了实际研究经验之后重读本书还能 获得新的感悟。”


雷达卡




京公网安备 11010802022788号







