楼主: rfu726693
1422 7

[其他] 实证结果求助!结果不一致 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

初中生

38%

还不是VIP/贵宾

-

威望
0
论坛币
1431 个
通用积分
69.0994
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
63 点
帖子
4
精华
0
在线时间
26 小时
注册时间
2022-4-18
最后登录
2025-2-6

楼主
rfu726693 发表于 2024-12-23 18:39:49 |AI写论文
100论坛币
OLS回归结果与双向固定效应回归结果相反怎么办?论文中允许这两个结果的不一致嘛?还是以哪个模型的结果为准?还是一定要模型结果一致?后续我要重新找变量使得其一致嘛
如下图第一列第二列是OLS回归,第三列是双向固定效应模型


regress tfp lnsub
regress tfp lnsub cps am2 peia dr lq
xtreg tfp lnsub cps am2 peia dr lq i.year ,fe
这是代码,麻烦大佬帮忙看看


附件: 你需要登录才可以下载或查看附件。没有帐号?我要注册

最佳答案

george_dong817 查看完整内容

在论文写作和实证分析中,OLS 回归与双向固定效应回归(two‐way fixed effects, 即同时控制个体和时间固定效应)的结果不一致是常见现象,并不一定说明模型有问题,也不要求“强行”让它们一致。出现差异的原因通常包括: 控制的未观测异质性不同 OLS 只是在可观测控制变量的基础上做回归,未控制住那些无法直接观测或度量的个体特征、时间趋势等。 双向固定效应回归能够剔除那些随个体不变或随时间不变但无法观测的因素, ...
关键词:回归结果 固定效应 OLS 怎么办

沙发
george_dong817 发表于 2024-12-23 18:39:50
在论文写作和实证分析中,OLS 回归与双向固定效应回归(two‐way fixed effects, 即同时控制个体和时间固定效应)的结果不一致是常见现象,并不一定说明模型有问题,也不要求“强行”让它们一致。出现差异的原因通常包括:

控制的未观测异质性不同

OLS 只是在可观测控制变量的基础上做回归,未控制住那些无法直接观测或度量的个体特征、时间趋势等。
双向固定效应回归能够剔除那些随个体不变或随时间不变但无法观测的因素,从而减少了潜在的遗漏变量偏差。
这些差异会导致系数在 OLS 和双向固定效应模型中出现一定程度上的不一致。
识别策略和假设不同

OLS 假定可观测控制变量已足够控制主要异质性,未考虑个体内在差异或时间趋势的影响。
双向固定效应要求在面板数据中,每个个体有足够的时间跨度,同时假定个体固定效应与解释变量不相关,时间固定效应与解释变量不相关等。若这些假设不成立,双向固定效应也可能带来偏误,但在很多场合下仍被认为比简单 OLS 更能减少遗漏变量问题。
模型目的与研究问题侧重点不同

如果研究重点是横截面差异或者没有足够的理论理由,可能不一定需要加入固定效应。
如果研究更关注随时间变化的效果,并且有理由相信有个体不变或时间不变的遗漏变量,“双向固定效应”会是更合适的选择。
在论文中如何处理 OLS 与双向固定效应结果不一致
报告并讨论差异

可以在实证部分同时报告两种模型结果:先给出最基本的 OLS 估计,然后再给出固定效应估计结果。
对比两种结果之间系数、显著性以及方向的变化,并从理论和数据特点出发讨论背后的原因。
根据研究目的与理论偏好选“主要”模型

如果论文的研究问题需要控制住个体与时间不可观测的异质性,并且数据结构适合(面板数据、时间跨度长、个体数多),那么双向固定效应往往被视作更有力的识别策略。
如果更关注截面差异,或者只想得到整体相关关系,且数据本身无法满足固定效应模型的要求(例如时间维度很短),那么简单的 OLS 也可以是合适的基础模型。
通常情况下,面板研究中倾向于在理论上更“严谨”的模型(如双向固定效应)上给出主要结论,而 OLS 结果作为参考补充。
不必“强行”让结果一致

由于两种模型所控制的异质性以及识别假设不同,结果不一致在所难免,并不一定是模型错了,也不一定是变量设置有问题。
盲目为了“让结果一致”而去更改或额外添加不必要的变量,往往会引入更多噪音或引发内生性问题。
进行稳健性检验与内生性讨论

为了增强说服力,你可以进一步做各种稳健性检验(如替换核心变量衡量方式、改变回归样本范围、增加交互项等),或考虑工具变量 (IV)、系统 GMM 等方法来处理潜在的内生性。
在不同模型、不同变量度量或不同样本下如果结论具有一致性,往往能增强论文的说服力。

总的来说,在学术研究中,报告并解释 OLS 与双向固定效应结果的不一致是常见且合理的做法,并不要求二者结果必须“完全一致”。若研究的问题和数据特征更倾向于面板分析,双向固定效应通常被视为更可靠的估计策略,你可将其作为主要结果。但也应同时解释为什么两种方法下结果存在差异,以及该差异可能反映出何种经济学含义或计量问题。

藤椅
leonxin 发表于 2024-12-23 22:18:30
在面板数据分析中,普通最小二乘(OLS)与双向固定效应(two‐way fixed effects)回归结果往往会出现差异,这是非常常见的情况。**是否“允许”二者结果不一致**,以及**究竟以哪个模型结果为准**,主要取决于研究设计、数据特征和经济学理论/经验分析的合理性。大体可以从以下几个角度来理解和处理:

1. **为什么会出现不一致?**  
   - **OLS未控制个体和时间不观察变量**:当我们采用最简单的OLS回归时,可能没有充分控制住在截面(企业、地区、个人等)和时间(年份、季度、月份等)维度上存在的异质性。如果这些不观察变量与所研究的自变量相关,就可能产生内生性偏误或遗漏变量偏误,从而导致OLS估计量不一致。  
   - **固定效应模型控制了更多异质性**:当引入双向固定效应后,模型会将所有“恒定于某个个体但随时间不变的特征”和“所有随时间变化但对所有个体相同的特征”都纳入到固定效应中,等同于为每个个体、每个时点都设置了一个“哑变量”,从而更好地解决了这些潜在的遗漏变量问题。所以固定效应模型得到的系数往往与OLS存在显著差异。

2. **两类模型结果都可以出现在论文中,但要清晰解释**  
   - **学术写作中并不要求不同模型估计出来的结果完全一致**,相反,展示不同模型下的估计结果,能够帮助审稿人和读者更好地理解模型假设及识别策略的差异,也让他们看到你的结果在多大程度上具有“稳健性”(robustness)。  
   - 一般来说,在论文中我们通常先给出最简单的OLS回归结果,然后逐步增加控制变量、固定效应、工具变量(如有需要)等更复杂的模型,并展示结果如何发生变化。这样可以让读者明白为何在加上了个体与时间固定效应之后,系数发生了变化,并给出合理的理论或数据层面的解释。

3. **应当优先参考哪个模型?**  
   - 在做面板数据分析时,如果我们的研究对象(企业、地区、个人等)在个体层面和时间层面上都可能存在无法直接测量或观察的特质,且这些特质又可能与核心自变量相关,那么**双向固定效应往往更能减少遗漏变量偏误,获得更可信的因果解释**。所以相对于OLS,双向固定效应模型的识别假设往往更严谨,得到的估计结果也被认为“更接近真值”。  
   - 不过,也要注意固定效应模型自身的限制(例如会“剔除”掉不随时间变化或在个体内方差太小的变量等),并确保你的研究问题是确实符合使用双向固定效应的前提假设。另外,如果变量在截面或时间上变化不大,固定效应模型对其系数估计可能不精确,甚至无法估计。

4. **如何在论文中呈现?**  
   - **透明呈现、合理解释**:可以在论文中同时报告OLS和双向固定效应的估计结果,并用文字或脚注说明为何结果不同,从理论和实证角度说明固定效应的好处、OLS潜在的偏误及其原因等。  
   - 如果要说服读者最终采用哪一种模型或哪几种模型的结果,可以做一些稳健性检验(robustness checks),如更换固定效应的形式、引入控制变量、做分组回归或工具变量法等。  
   - 如果发现OLS和固定效应结果完全相反,需要进一步排查:是否有多重共线性、样本结构问题、极端值影响,或者是因为固定效应去掉了重要的跨截面差异,从而改变了估计结果。

**总之,论文中并不要求不同模型结果必须完全一致。**相反,在面板数据分析的典型写法中,会先展示OLS结果,随后再引入固定效应做“更严谨”的回归,并讨论二者为何不同。通常在经济学实证研究里,如果双向固定效应的前提假设较为合理,那么往往会更偏向于将双向固定效应的结果作为主要结论;但也需要结合研究情境、数据特征以及稳健性检验来最终说服读者。

板凳
Harlur 学生认证  发表于 2024-12-24 11:57:00
建议顺便附上代码以便检查是否是由于代码错误所致

报纸
rfu726693 发表于 2024-12-24 17:53:50
Harlur 发表于 2024-12-24 11:57
建议顺便附上代码以便检查是否是由于代码错误所致
regress tfp lnsub
regress tfp lnsub cps am2 peia dr lq
xtreg tfp lnsub cps am2 peia dr lq i.year ,fe
你好,这是代码,帖子我也重新编辑了

地板
Harlur 学生认证  发表于 2024-12-24 19:35:30 来自手机
rfu726693 发表于 2024-12-23 18:39
OLS回归结果与双向固定效应回归结果相反怎么办?论文中允许这两个结果的不一致嘛?还是以哪个模型的结果为准 ...
尝试固定年份和个体后不加控制变量进行回归,看看系数是否和加了控制变量的双向固定保持一致,一致的话就可以用,同时不要保留没固定的回归结果
出现这种现象是正常也是有可能的,因为固定后意味着控制了年份和个体不同的影响,固定后的结果才是正确的结果,保留固定后的结果即可,没必要为了篇幅保留未固定的

7
george_dong817 发表于 2024-12-29 07:49:21
对比OLS、固定效应模型和随机效应模型(如 xtreg ... , re),并通过Hausman检验判断固定效应是否是更优的选择:

xtreg tfp lnsub cps am2 peia dr lq i.year , re
hausman fe re
检查自变量的内生性:

如果 lnsub 或其他变量可能是内生的,可以尝试工具变量法(IV/GMM)来处理内生性问题:

ivregress 2sls tfp (lnsub = 工具变量) cps am2 peia dr lq
重新检视变量设定:

确认控制变量是否恰当,是否遗漏了关键变量或引入了无关变量。
解释模型差异的理论基础:

论文中可以解释OLS和FE模型的不同适用情境:
OLS模型更适合在没有个体或时间效应干扰时使用。
FE模型适合捕捉个体和时间不可观测因素的影响。
不要求模型结果完全一致,但需要有合理解释。


论文中可以分别报告OLS和FE的结果,并重点讨论固定效应模型的结果(假设Hausman检验支持FE)

8
赵安豆 发表于 2025-1-6 06:15:27
遇到OLS回归结果与双向固定效应回归结果不一致的情况时,通常需要深入分析背后的原因。这种现象可能由多种因素造成:

1. **模型规格**:OLS假设了所有观察值都是独立同分布的(i.i.d),而面板数据中的个体效应或时间趋势可能违反这一假设。双向固定效应模型通过控制个体和时间的固定效应,来解决这些问题。

2. **遗漏变量偏误**:如果OLS模型中遗漏了重要的解释变量,尤其是与已包含的自变量相关的变量,那么回归结果可能会受到偏差的影响。双向固定效应模型在一定程度上能缓解这个问题,因为它可以吸收被遗漏但随时间不变的个体特征(如某些企业特质)。

3. **样本大小和结构**:面板数据集的结构对两种模型的结果有很大影响。如果数据集包含大量时点或个案,那么双向固定效应模型可能更加准确;反之,则OLS可能表现得更好。

在论文写作中:

- 你完全可以报告这两种模型的结果,并探讨其差异的原因。
- 可以根据研究目的和理论假设来选择更合适的模型。例如,如果研究关注的是个体随时间的变化而非个案间的比较,双向固定效应可能是更优的选择。
- 如果结果不一致是因为遗漏变量或模型规格问题,你应该尝试通过添加控制变量、使用不同的估计方法(如随机效应)或进行敏感性分析等手段来解决。

最后,并非一定要使得两种模型的结果完全一致。重要的是清楚地解释为什么选择了某种模型以及它的优势所在。如果能通过理论基础和实证检验合理说明为何选择特定的回归结果,那么论文的质量将得到提升。

对于你给出的具体代码,“regress”是进行普通最小二乘法(OLS)估计,“xtreg...fe”则是面板数据双向固定效应模型。从“i.year”可以看到,时间固定效应也被加入了。如果发现模型结果不一致,你可以尝试:

- 检查数据的异质性,比如对个体或时点进行分组分析。
- 增加控制变量,尤其是那些可能影响因变量但OLS中遗漏了的变量。
- 对模型假设(如异方差、自相关)进行检验,并采取相应调整。

希望这些建议能帮助你进一步理解和解释你的回归结果。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 04:30