楼主: olympic
3319 10

[程序分享] 固定效应回归模型 [推广有奖]

  • 0关注
  • 9粉丝

已卖:483份资源

泰斗

51%

还不是VIP/贵宾

-

威望
0
论坛币
65160 个
通用积分
7568.0273
学术水平
200 点
热心指数
243 点
信用等级
179 点
经验
4002 点
帖子
29105
精华
0
在线时间
10019 小时
注册时间
2014-4-10
最后登录
2026-1-6

初级热心勋章 中级热心勋章 20周年荣誉勋章

楼主
olympic 发表于 2023-2-18 09:01:24 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
众所周知,“相关并不意味着因果关系”。 我要告诉你,相关可以表示因果关系,但需要一定条件。 这些条件已在计量经济学文献中被广泛讨论。 在本文中,我将以一种易于理解的方式对其进行总结。 我将解释如果不满足这些条件为什么标准的普通最小二乘(OLS)无法确定因果关系。 然后,我将介绍可以提供有效解决方案的固定效应(FE)模型。 之后,我将使用两套数据分析示例向您展示如何在python中进行操作。 我希望本文能够通过良好的设计和令人信服的结果增强您对因果关系的理解。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:固定效应 回归模型 计量经济学文献 python 经济学文献

沙发
olympic 发表于 2023-2-18 09:02:07
相关可以表示因果关系 — 仅在满足某些条件时
让我们给出因果关系的正式定义。 因果关系是x导致y。 关联意味着x和y沿相同或相反的方向一起移动。 因果关系应满足以下三个经典条件:
x必须在y之前发生
x必须与y相关
x和y之间的关系不能用其他原因解释。

藤椅
olympic 发表于 2023-2-18 09:02:46
从相关性推断因果关系是一件很难的事
冰淇淋销量的增长与夏季鲨鱼的袭击密切相关。 您认为这有意义吗? 这是一种关联,但不是因果关系,因为并非以上三个条件中的所有条件都成立。 首先,鲨鱼袭击的次数不会随着冰淇淋销售的增加而增加。
其次,冰淇淋销售量的增长与鲨鱼袭击之间的相关性可能始终存在,也可能不是始终存在。 第三,也是最重要的一点,两个因素之间的关系可以用夏季来解释。 实际上,炎热的夏天是冰淇淋销售量增加和鲨鱼袭击增加的驱动力。

板凳
olympic 发表于 2023-2-18 09:03:15
混杂因素(Confounding Factor):冰淇淋销售量x和鲨鱼袭击次数y都受夏季热量,混杂因素z的驱动。 混杂因素是一个既影响因变量y又影响自变量x的变量,从而导致了虚假关联。 一项研究可能会忽略混杂因素。 因为我们没有收集足够的数据,所以它是不可观察的。 而补救措施是将混杂因素识别为可观察的因素。

报纸
olympic 发表于 2023-2-18 09:03:38
内生性:如果存在一个混杂因素可以解释x和y之间的关系,则x是内生的。x和y之间的相关性也无法解释或毫无意义。 您能说冰淇淋销售与鲨鱼袭击之间存在正相关关系吗? 我们不应试图从正号或负号得出任何结论。 事实是该系数可以更高,更低,甚至不同。

地板
olympic 发表于 2023-2-18 09:04:03
如何量化X对Y的影响?
为了衡量治疗的效果,我们必须与没有治疗的事实进行比较。 换句话说,我们讨论如果个人不接受治疗会产生什么结果。

7
olympic 发表于 2023-2-18 09:04:35
随机对照试验(RCT)通常是非常好的标准

我们要怎么解决这个难题呢? 随机对照试验(RCT)通常被视为非常好的标准,因为可以确定因果关系(Shadish et al,2002)。 如果我们可以将个体随机分配到治疗组和对照组,那么两组的个体特征将大致相等。 那么,治疗效果就是两组之间的y之差。

让我用一种统计的方式来进行以上描述。 普通最小二乘(OLS)假设x与不可观察项之间没有相关性,即没有内生性。 这可以用RCT中实现,因为随机分配下不可能出现内生性或混杂问题。 在下式中描述了OLS,其中i是N个个体中每个个体的标识符。 第二个方程是矩阵形式。 关键假设是E(X)= 0,这表示x与不可观测项之间没有相关性。 错误项可能是任何不可观察的项。

但是,在大多数情况下进行RCT会不可行。 RCT可能很耗时,或很昂贵,或难以向需要合作的公众解释,并且有时是不道德的。 例如,在医院中,研究人员可能会建议将患者保留为对照组。 这显然不可行,因为该研究使患者处于危险之中。 并非所有决策问题或临床实验都可以遵循RCT。 那我们还有什么办法? 研究人员越来越依赖于准实验设计并取得了令人信服的结果。 “准”一词表面上看起来表示不是真的。 准实验设计类似于随机对照试验,但没有对研究者进行随机分配(Cook&Campbell,1979)。

8
olympic 发表于 2023-2-18 09:06:57
固定收益数据分析示例2 –交通death率与啤酒税

更高的啤酒税是否有助于减少交通death率? 许多州降低了啤酒税,交通事故death率更高。 我们可以说降低啤酒税会导致更高的death率吗? 这种因果关系具有深远的政策含义。 我将使用Stock&Watson广为接受的书籍“计量经济学概论”中的death数据集。

9
olympic 发表于 2023-2-18 09:08:28
import pandas as pd
import numpy as np
import seaborn as sns
fatalities = pd.read_csv('/fatality.csv')
fatalities.head()


mrall = 车辆总death率
beertax = 酒精税
mlda = 最低法定饮酒年龄
jaild = 强制性入狱
comserd = 强制性社区服务
vmiles = 每位驾驶员的平均里程
unrate = 失业率
perinc = 人均个人收入
我将每年的数据生成平均值,以显示每年的平均啤酒税和death率。 1982–1984年的平均啤酒税高于1986–1988年的啤酒税。

avg = fatalities.groupby('year')['mrall','beertax'].mean()
avg


我将使用`seaborn来显示相关性。

sns.set(style="darkgrid")
g = sns.jointplot("beertax", "mrall",
data=avg, kind="reg",
color="m", height=6)

10
laomm002 发表于 2023-2-18 11:08:38

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-7 06:14