楼主: 杨明凡
2732 3

[水煮经管] 理论模型有多重要?(上)) [推广有奖]

巨擘

0%

还不是VIP/贵宾

-

威望
5
论坛币
186588 个
通用积分
7693.3563
学术水平
2591 点
热心指数
3812 点
信用等级
3521 点
经验
115140 点
帖子
32158
精华
1
在线时间
8337 小时
注册时间
2013-11-21
最后登录
2024-1-31

初级热心勋章 中级热心勋章 初级信用勋章 中级信用勋章 高级信用勋章 高级热心勋章 特级热心勋章 初级学术勋章 特级信用勋章

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

模型在微观实证研究中的作用——以城市和区域经济学为例


1. 引言


作为经济学者,我的专业领域是城市和区域经济学,近年来主要研究中国城市化进程中的一些问题。因为这个原因,我一直关注国内的学者在这方面的研究,在学术会议上和为期刊审稿的过程中,经常接触国内同行的论文。我从国内同行的实证研究中学到很多,他们在研究中所体现出的关心现实问题、努力挖掘数据、强调因果识别、注重政策影响等特点,十分值得提倡和借鉴。


同时我有一个感觉(当然也可能是错觉),就是国内同行的大部分实证研究不用经济学理论模型,而以独立的回归分析为主,即使提到理论,也多是文字性的描述,较少做数学推导。其实这些同行绝大多数是国内外正统经济学系的博士,我相信他们都在研究生院里接受过严格的理论训练,对理论模型并不陌生,但在研究的实践中较少使用这方面的技能,似乎形成了一种风气。


2018年9月初,我在南京参加了一个城市和区域经济学会议。因为有很多国内的年轻同行参会,我就决定利用这个机会讨论一下理论模型在实证研究中的作用。我想表达的观点是:我们领域大量的实证研究是以模型为依托的,这是因为模型有很多不同的作用;年轻学者应该重视建模的技能;否则的话,如果总是脱离模型来做研究,不但会影响研究的深度,也会限制选题的广度。


这篇短文是把会上的发言整理出来,做了一些扩充,为的是理清自己的思路,以便继续跟同行们讨论这个重要问题。因为专业的背景,我这里列举的文献基本都来自于城市和区域经济学。但是我相信,这里的主要观点也适用于其它的应用微观经济学领域,包括劳动、发展、环境、贸易、产业组织等。


2.经济科学、实证研究以及模型的用途


在谈模型的应用之前,我需要讲讲什么是实证研究和什么是模型。而在此之前,我必须明确一点,那就是:我们这些以学术为职业的经济学家做的是科学研究。所谓科学,是一个领域的知识的总和;而这些知识是由这个领域的研究人员群体通过从事以下四类活动一点点积累起来的:


(1) 记录 (Documentation) —— 通过观察和测量把现实中可能有必要去研究的现象、规律以及变量之间的关系等记录或描述下来。


(2) 理论化 (Theorization) ——对现实中的现象、规律以及变量之间的关系等给出一个合乎逻辑且可供检验的解释。


(3) 检验 (Verification)——用通过观测或实验所得来的数据对理论的含义 (implication) 和推测 (prediction) 进行检验。得到验证的理论当然也不一定就正确,但是我们对它的信心会增强;跟现实不符的理论需要去修正(即回到(2))。


(4) 应用 (Application)——用现有的理论解释更多的现象、规律和变量之间的关系;用现有的理论帮助解决现实问题。

这一套积累知识的方法,就是我们通常所说的科学的方法。用这套方法研究自然现象,就形成了自然科学,如物理、化学、生物等;用这套方法研究人类行为和社会现象,就形成了社会科学,如经济学、心理学等。


我们在经济学的文献里不难列举出上面每一类的工作。Burchfield et al. (2006) 用卫星遥感数据对城市蔓延的刻画、我本人参与的对小企业是否创造了更多就业的研究 (Neumark et al., 2011),都是记录一类的工作。Henderson (1974) 关于城市为什么有大有小的解释,就是理论化的工作。Hamilton (1982) 以及后续的关于“浪费性通勤” (wasteful commuting) 的研究 (White, 1988;Small和Song, 1992),都是要验证单中心城市理论的一个推论,属于检验一类的工作。而Au和Henderson (2006) 关于中国的城市规模是不是普遍小于最优规模的研究,则是用现存的理论回答大家关注的一个现实问题,属于应用一类的工作。上述(1)、(3)、(4) 三类工作都涉及数据的应用,都可以看作是实证研究(empirical research)。


那么什么是模型 (model) 呢?模型是一个简化的现实世界 (a simplified representation of reality)。真实世界很复杂,我们在做科学研究时,经常需要忽略真实世界的某些方面,只关注跟手头的问题最相关的现实。尤其是在试图解释真实世界里的某个现象时,我们往往需要借助于一个经过简化的、用来代表真实世界的东西来表述我们的想法,我们管它叫做模型。不光是经济学家,各个科学领域的学者都使用模型,特别是在做理论化的工作时。


图一是自然科学家们使用的两个模型。以左边的地球运行轨道模型为例,我们很容易能认识到,它是个经过简化的真实世界。简化有两类,一类是直接忽略现实中的某些方面。比如这个轨道模型就省略了地球和太阳之间的水星和金星。另一类简化是对现实世界的扭曲(distortion)。譬如这个模型里的太阳就被缩小了很多倍;相对于地球和月亮,真实的太阳要大得多。太阳和地球之间的距离¾相对于地球的半径来说¾也被缩小了很多。这个模型虽然被简化得不真实了,却很有用:我们如果借助于它来解释地球上日食和月食的成因(讲解特定的理论),就特别容易让别人理解。与此类似,右边的脱氧核糖核酸(DNA)模型也做了简化,例如每个碱基(两条螺旋链之间互补配对的部分)的分子结构都比模型中显示的复杂得多。我们虽然没有亲眼见过DNA,也能猜出它的每一部分之间不会有那么明显的颜色对比,模型设计者扭曲了颜色以便让我们更能看清DNA的结构。这两个例子告诉我们,科学研究人员做的模型,目的不是求真实,而是求有用、能帮助他们展示和表述理论。


10.png


9.png

(图片来源:https://www.gtsimulators.com/Orbiter-Model-p/h101.htm; https://arresspro.com/ dna-model)


经济学家用的模型也是一样的。我们也做简化:有的模型直接忽略了政府的存在;有的假设这世界上只有两个国家、两种产品。不同的是,我们经济学家不经常使用实物模型,而是用图形和数学方程式。 也就是说,除了简化,我们还做了抽象化,譬如用曲线上每一点的高度代表消费者的支付意愿、用函数关系代表企业的生产技术约束、等等。从这个角度来说,经济学家使用的模型特别像是地图(Krugman, 1994)。 地图也做简化,譬如交通图会忽略地面的建筑、地铁路线图会把弯道拉直;地图也做抽象化的处理,有宽度的街道变成了一条细线、奇形怪状的城市变成了一个圆点等等。地图不真实,但是我们都知道它有用。有意思的是,正是地图的不真实,让它变得更有用:想找行车路线的人,会上网查谷歌地图,很少有人去查更真实的谷歌卫星照片。经济学家用的模型也是一样的,不求真实、只为有用。


由此说来,经济学模型当然是在理论化的工作中起的作用最大。在近几十年的经济学发展过程中,主流经济学理论的展示几乎全是通过模型推导来实现的。模型也就占据了每个理论最核心的逻辑推理部分。


那么实证经济学研究为什么能用到模型呢?一则是因为有一部分实证研究的目的是要检验理论,需要表述理论,而此时使用模型推导经常会使表述更方便、清晰、严谨。应用一类的实证工作因为要用到现存的理论,而现存的理论多是围绕模型写成的,当然也会用到模型来表述理论。


这么说来记录一类的工作就用不到模型了?也能用到。这跟经济学领域的一个传统有关。在自然科学领域,可能因为发展时间长而使得分工更细,即使是针对同一个自然现象,记录、理论化、理论验证的工作也完全可以由不同的研究团队来完成。而在经济学领域则不然,单纯的记录性的工作不太容易被发表,研究人员往往要同时做一些理论化的工作来解释记录的现象,才能被认为是重要的贡献。以Eeckhout (2004) 为例,他用大量的人口普查数据来说明,美国城市人口规模服从Zipf分布的说法只适用于大城市,如果把小地方也包括进来,则服从对数正态分布。对数正态分布的一端和Zipf分布非常接近,光看大城市时不易区分。按说这个作为记录性的工作已经不错了,但是他在文章里继续往下做,写了一个模型,给对数正态分布的出现做一个理论解释。这样的例子有很多,即经济学者时常把记录性的工作和理论化的工作合并,就导致记录性的实证研究里也常常出现理论模型。


总结来说,经济学家和其他科学领域的研究人员一样,要做描述现象、验证理论和应用理论一类的实证研究。在这几类研究中都会涉及理论,而大部分理论是用模型推导的形式表述的,就导致实证经济学研究里会常常用到理论模型。


3. 以模型为依托的实证研究的比重


我们来做个简单的统计,看看近年来最重要的城市和区域经济学研究中有多少是实证研究,其中又有多少用到了理论模型。图二对经济学五大顶级期刊在2001-2018年间发表的城市和区域经济学领域的论文做了分类。五大期刊当然不具有代表性,但是完全有理由认为,这些论文是本领域最具影响力的研究成果。


从图中可以看出,纯理论的研究相对很少,只占7%;绝大多数的论文属于实证研究。这个倒也不难理解。经济学近三十年来较少有理论突破,既没有重大的范式改变(譬如引入理性预期的假设),也没有新的逻辑语言的引入(譬如博弈论语言的应用),更没有重大的理论创新。而这期间信息技术的飞速发展使数据的来源增多了,计算成本降低了,极大地促进了实证研究的发展。这个趋势贯穿于经济学的各个分支(Hamermesh, 2013)。


8.png

图二:以模型为依托的实证研究的比重,2001-2018


我把实证研究按照与模型的关系细分成几类。一类是没有任何模型的实证分析,这一类的文章占到总数的31%。这类研究并非不涉及理论。正如上面提到的,几乎每一种实证研究都离不开理论。这些研究没用到模型,只是因为其中的理论相对简单,几句话就可以说清楚,没必要做数学推演。以Baum-Snow (2007)为例,他想看美国高速公路系统的建立是不是推动了城市人口向郊区的转移。这个问题的逻辑一目了然,难点在于如何解决内生性的问题,就不需要用模型。再比如,Hodler和Raschky (2014)用全球的卫星灯光数据度量经济发展,看各国领导人的家乡是不是经济更加繁荣。这个问题的逻辑也不难理解,也就没有必要用模型。我前面说到国内的学者做实证研究时一般不用理论模型,就是说他们的研究大都属于这一类,问题的逻辑相对简单明了,不需要借助模型来表述。

其余超过全部研究60%的论文都用到了模型。这里面又大致可以分为三类:一类只是用模型说明道理,回归分析中估计的并不是模型的参数,我们把这一类研究叫做“以模型为依托的、非结构性的回归分析”;第二类不光用模型说明道理,而且所做的回归分析的目的就是为了估计模型的参数,我们把这一类研究叫做“以模型为依托的、结构性的回归分析”;最后一类应用的模型特别复杂,以至于模型的参数之多已经很难一次全部估计出来,不得不从他人的研究中借用一些参数的估值来进行反事实的分析,我们把这一类研究叫做“以模型为依托的、结构性的校准分析”。

我们下面就根据这个分类一一具体讨论模型在每一类实证研究中的应用。


4. 模型在非结构性实证研究中的作用


先来澄清几个概念。上面已经提到,结构性实证研究的目标就是要获得理论模型的参数,以便用模型来估算政策的效果或事件的影响。那么不是以获取模型参数为目标的研究,我们就称之为非结构性的研究。与结构性回归分析相对应,经济学家常常提到简化型的回归(reduced-form regression)。早期的理论经济学模型经常是一组(线性)方程,每个方程是一些内生和外生变量之间的关系,方程里的系数被称为结构性参数。直接用回归分析估计这组方程里的系数,就是结构性回归分析。另外一种常见的做法,是对方程组求解,把每一个内生变量表达成一组外生变量的函数,而根据这些函数用内生变量对外生变量做回归分析,就是简化型的回归分析。用简化型回归分析估计出来的系数一般来说不是模型的参数,而是模型参数的函数。近些年来,简化型回归分析这个概念有了更广义的用法,对一切从模型推演出来的或根据理论直觉写下的变量关系所做的回归分析,只要不是以获取模型的参数为目标,都可以叫做简化型回归分析。从下面的讨论中可以看到,我这里用的非结构性研究的概念,比广义上的简化型回归分析涵盖的种类还要多,包括用回归方法寻找断点、探究新建的指数与哪些变量相关等实证工作。

按照Holmes (2010)的说法,我们又可以把非结构性的研究细分为两类。一类是描述性的研究,只是给出不同变量之间的相关性,而不太注重因果关系的识别。早期的实证研究大多属于这一类。另外一类是基于实验方法(experimentalist approach)的研究,就是通过“自然实验”或是“可控实验”,来识别一个变量对另一个变量的因果效应(causal effect),其目标也是要估算政策的效果或事件的影响。我在这一节虽然把Holmes所说的两类非结构性研究合并在一起来讲,但也会偶尔提及这个分类。

4.1  模型能帮助澄清实证研究的目的和意义


随着信息技术的发展,数据越来越多,数据里的变量也越来越多,可供考察的变量之间的关系更是呈几何级数增长。那么我们做实证研究为什么要去看某个特定的变量之间的关系呢?这是每一篇报告实证研究结果的论文都需要讲清楚的问题,而借助于一个简单的模型常常是把这个问题讲清楚的最有效的方式。

最常见的例子是用模型阐明一个理论、导出两个变量之间是正相关或负相关,然后用回归分析验证这个关系。譬如Storeygard (2016)用模型说明,运输成本升高对远离经济中心的城市有更大的负面影响,他用非洲的数据检验这个推断。Lee和Lin (2018)用模型导出三个不同的变量关系,例如其中之一是说自然条件优越的街区更容易成为高收入的街区并能长期保持这种地位,他们用跨时一个多世纪(1880-2010)的美国人口普查数据来验证这些变量关系。一般来说,这类实证研究探索的是较深层次的变量之间的关系,这些关系背后的逻辑不是三言两语就能说清楚的,所以才有利用模型来表述的必要。

另有一些实证研究检验更加复杂一些的理论推断,比如说,涉及数量关系中斜率的变化或断点的存在。譬如Glaeser和Gyourko (2005)的文章指出,房产的寿命很长,因而一个城市的房产需求在萎缩和增加时,对城市的影响是不对称的。当需求萎缩时,房产并不会马上消失、供给是刚性的,因而房价会大幅下跌而城市人口只是缓慢地减少;而当需求增长时,只要房价高于建设成本就会有新房上市、供给是有弹性的,因而房价会缓慢上涨而人口会迅速增加。Glaeser和Gyourko (2005)用一个简单的模型推导出增长的城市和衰落的城市的各种不同表现,并用美国的数据对结果进行一一验证,为我们了解衰落的城市提供了一个新颖的视角。

Card et al. (2007) 研究美国城市街区种族构成变化的“倾覆点” (tipping point)。这个概念引起经济学者的注意,最早始于Thomas Schelling (1969, 1971)。它是指城市里的街区一旦少数族裔的比例达到了“倾覆点”,白人居民会加速地搬出该街区,最终致使街区成为少数族裔聚居的地方。Schelling早就指出,一些看似不重要的偶然事件足以把一个街区推过这种临界点,引起剧烈的变化。他的这个研究影响很大,其中的洞见被应用到很多别的领域甚至被写进了畅销书(Gladwell, 2001)。Card et al. (2007) 用一个简单的模型,演示在什么情况下会出现街区种族构成的“倾覆点”,并用美国的人口普查数据来估计每个城市的“倾覆点”,看它与哪些城市的特点是相关的。

上面提到的后两篇文章用的数据是常见的普查数据,统计分析方法相当简单,在因果识别方面没有任何创新。这样的文章被顶级期刊接受发表,主要是两者都在分析重要的学术问题。严格说来,这两篇文章涉及的理论问题用纯文字的语言也可以讲清楚。但是模型的使用¾两篇文章都是既用了图表又用了方程式¾无疑让作者们把问题说得更清晰、简洁、逻辑严谨,让读者更容易认识到实证分析的必要性。

4.2  模型可以给新观察到的现象一个严谨的解释


正如上面提到的,经济学家常常把记录和解释现象合并在一起来做,而解释现象时往往需要借助于模型。上面提到的Eeckhout (2004) 就是这样的研究。作者首先用数据表明美国的城市人口规模服从对数正态分布,然后用一个模型来解释为什么会是这样的。

Knoll et al. (2017)也是类似的套路。他们收集了14个发达国家在1870-2012年间的年度房价,发现二十世纪中期以前各国住房的实际价格普遍比较稳定,此后都经历了长时间的大幅度的上升。作者们认为这不是建筑成本上升的结果,而是由地价上涨造成的。他们写了一个模型,具体解释二战以后什么原因导致地价的攀升进而推高了房价。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
citycitt 发表于 2022-6-29 23:36:08 |只看作者 |坛友微信交流群
讲的太棒啦

使用道具

藤椅
encn 发表于 2022-7-2 09:40:56 |只看作者 |坛友微信交流群
学习了,谢谢提供分享!

使用道具

板凳
橘子不酸酸 学生认证  发表于 2022-8-12 15:20:05 |只看作者 |坛友微信交流群
茅塞顿开,感谢分享

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 06:09