楼主: 0261301638
23606 6

[面板数据求助] 非平衡面板数据回归得出的结果有意义吗? [推广有奖]

  • 2关注
  • 0粉丝

讲师

31%

还不是VIP/贵宾

-

威望
0
论坛币
501 个
通用积分
78.4329
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
6517 点
帖子
259
精华
0
在线时间
343 小时
注册时间
2019-11-2
最后登录
2025-8-30

楼主
0261301638 发表于 2020-8-24 15:42:28 |AI写论文
200论坛币
如题,最近在不断得学习stata计量经济学当中,过去做回归,一直都是在平衡面板数据的基础上进行的,在不少的学习资料中,我发现:1.有的人认为,做回归必须要讲非平衡面板数据处理成平衡面板数据(但是这样会删掉许多数据)2.有的人则认为,非平衡面板数据也可以直接用于回归。如:非平衡面板数据模型的估计方法及应用------吴勇,林悦。
那么问题是:非平衡面板数据直接回归和经处理后的平衡的面板数据回归,得出的结果会有较大的差异吗?期刊和论文中,用非平衡面板做回归的情况多吗?
123.png
注意:我讲的是面板数据是否平衡,而不是是否平稳。



关键词:非平衡面板数据 面板数据回归 非平衡面板 面板数据 平衡面板

沙发
0261301638 发表于 2020-8-24 20:12:40
有没有大佬来教一下呀?求学习!

藤椅
黃河泉 在职认证  发表于 2020-8-26 09:16:40
"极大部分"的文章都是用"非平衡面板资料" 。

板凳
蓝色 发表于 2020-8-26 11:52:13
可以购买
面板数据计量经济分析    -巴尔塔基
等面板数据的图书看看理论。



未命名2.png

报纸
bca 发表于 2020-8-31 11:54:35
我来简单回答下吧,楼主批判吸收
首先讲下基本结论:如果你的核心故事(x和y的基本关系)是合理的,平衡面板和非平衡面板不会有差异,只需要按照你的数据结构回归即可。
原理:无论做什么研究,大家关注的是y的变差被解释的程度,面板数据的特征在于,把y的变差分为个体间的变差(i和j之间)和个体内变差(i之内)【同样,如果你关心的是t,可分为t内和t之间变差】。为什么面板数据需要检查固定效应呢,就是看变差被解释程度,进而看是否加入固定效应。——上述逻辑和平衡不平衡没关系。

问题来了:为什么平衡面板和非平衡面板之间结果有差异?该选哪个?
答案:样本选择偏差……当你把非平衡样本drop掉一部分样本,使得它平衡,样本就成了阉割版。drop的样本一般具有某些独特的特点,比如新的公司(年份不够)被删除了,再比如,某些公司某些时候停牌了看不到相关观测;再比如,某些个体死掉了……各种各样的原因了。所以一般来说drop那些非平衡的部分都带有明显的样本选择偏差。
该怎么选择呢?看你讲故事的能力了和你目标杂志。对于老外来说,drop样本慎之又慎;国内大部分期刊,对于drop样本关注度还不是很高
已有 5 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
灞上柳生 + 4 + 4 + 4 精彩帖子
wyw986608200 + 1 + 1 + 1 精彩帖子
LechenWang + 1 + 1 + 1 精彩帖子
Bigeyes + 1 + 1 + 1 精彩帖子
admin_kefu + 30 + 3 + 3 + 3 精彩帖子

总评分: 论坛币 + 30  学术水平 + 10  热心指数 + 10  信用等级 + 10   查看全部评分

地板
Bigeyes 发表于 2022-2-28 15:56:08
bca 发表于 2020-8-31 11:54
我来简单回答下吧,楼主批判吸收
首先讲下基本结论:如果你的核心故事(x和y的基本关系)是合理的,平衡面 ...
受教了

7
赵安豆 发表于 2025-11-25 14:48:34
非平衡面板数据(unbalanced panel data)在实际研究中非常常见,这是因为收集所有观测单位的所有时间点数据往往是不现实的。例如,有的观测对象可能中途退出了研究,或者有的年度的数据无法获取等。对于是否可以直接使用非平衡面板数据进行回归分析的问题,答案是肯定的——可以,并且这是计量经济学中的标准做法。

1. **直接用非平衡面板数据做回归**:现代统计软件(如Stata、R或SAS)都能处理非平衡面板数据而无需将其转换为平衡形式。这些软件在进行估计时会自动忽略缺失的数据点,不会对可用的观测值造成任何影响。实际上,在大多数情况下,直接使用非平衡面板数据可以更好地利用所有可得信息。

2. **平衡与非平衡数据结果差异**:从理论上讲,如果平衡和非平衡面板数据包含的信息量相同(即,除了某些单位在某些时间点上的缺失外),它们的回归结果应该是一致或非常接近的。然而,在实践中,由于缺失的数据可能具有某种模式或原因,使用非平衡数据可能会导致不同的估计结果。例如,如果缺失是随机的,则影响较小;但如果缺失与某个未观测到的因素有关,那么这将引入偏差。

3. **期刊和论文中的应用**:在社会科学、经济学和其他实证研究领域中,使用非平衡面板数据进行回归分析的情况非常普遍。事实上,在实际数据集几乎总是不完美的情况下(即总有一些数据点缺失),使用能够处理这种类型的复杂性的方法是必要的。

因此,对于你的问题——直接用非平衡面板数据做回归是有意义的,并且在学术研究中广泛接受和使用。但是,与所有统计分析一样,重要的是要理解和考虑数据的特点以及可能对结果产生的任何偏倚或影响。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-5 12:55