楼主: ALLzjc
5906 6

[面板数据求助] 面板数据负二项回归无法收敛 [推广有奖]

  • 1关注
  • 0粉丝

大专生

31%

还不是VIP/贵宾

-

威望
0
论坛币
2 个
通用积分
1.1716
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
161 点
帖子
20
精华
0
在线时间
76 小时
注册时间
2019-8-19
最后登录
2025-12-23

楼主
ALLzjc 发表于 2022-7-20 23:02:55 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据:面板数据,user-month为分析单元,一共包括1,983名用户,24期。由于因变量为计算变量,所以打算用泊松回归或负二项回归:
①采用负二项回归的命令为
xtnbreg y x1 x2 c.x1#c.x2 c1 c2 c3 i.date, fe irr
结果显示3200  conformability error
          opt__cns_off():     -  function returned erro
②采用泊松回归的命令为
xtpoisson y x1 x2 c.x1#c.x2 c1 c2 c3 i.date, fe irr
结果显示cannot compute an improvement -- discontinuous region encountered

但是如果把i.date去掉,即xtpoisson y x1 x2 c.x1#c.x2 c1 c2 c3 , fe irr,就能获得回归结果,想问一下这是为什么,以及这种情况该怎么办?

还有,因变量为计数变量时,是不是必须用泊松或负二项回归,OLS回归可以用吗?

感谢各位的解答!!!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:负二项回归 面板数据 IMPROVEMENT ENCOUNTERED Continuous 面板数据 负二项回归 无法收敛 泊松回归 固定效应

沙发
512works 发表于 2022-7-22 16:08:31
变量太多会导致iteration过多和计算量过大,建议后面的选项加上diff,这样迭代不出来会替换算法,有可能跑出来结果。

藤椅
512works 发表于 2022-7-22 16:10:05
理论上说poisson,负二项这些回归是基于被解释变量的分布形态提出来的假设,你如果要用OLS估计计数变量甚至0-1变量都不能算错,只是分布形态必然不是正态分布会导致估计结果不精确和系数意义存疑之类的问题。

板凳
ALLzjc 发表于 2022-7-28 16:16:46
512works 发表于 2022-7-22 16:10
理论上说poisson,负二项这些回归是基于被解释变量的分布形态提出来的假设,你如果要用OLS估计计数变量甚至 ...
感谢您的解答

报纸
ALLzjc 发表于 2022-7-28 16:27:06
512works 发表于 2022-7-22 16:08
变量太多会导致iteration过多和计算量过大,建议后面的选项加上diff,这样迭代不出来会替换算法,有可能跑 ...
好的好的,谢谢老师

地板
yycdb 发表于 2024-9-27 23:27:21
512works 发表于 2022-7-22 16:08
变量太多会导致iteration过多和计算量过大,建议后面的选项加上diff,这样迭代不出来会替换算法,有可能跑 ...
请问在哪里加diff呀

7
赵安豆 发表于 2024-10-12 19:33:45
在面板数据模型中遇到无法收敛的问题通常有以下几种可能的原因:

1. **多重共线性(Multicollinearity)**:自变量之间高度相关可能导致估计不稳定和收敛问题。

2. **数据异常值或极端值**:异常的观测值可能会导致算法难以找到最优解。

3. **模型设定错误**:如使用了不适合数据分布的回归方法,或者模型中包含了一些不相关的变量,也可能是因为交互项(例如`c.x1#c.x2`)引入了复杂性而超出了算法收敛的能力。

4. **计算问题或软件限制**:有时候是由于软件内部的优化过程遇到了极限情况,如迭代次数达到上限但仍未找到最优解等。

对于你的具体问题:

- 在加入`i.date`(时间虚拟变量)时遇到无法收敛的问题,可能是因为引入了过多的自由度。在有大量时间点的情况下,这可能导致模型过于复杂,从而难以估计,特别是在固定效应模型中,每个个体都有一个截距项,加上每期的时间效应可能会造成参数数量大幅增加。

- 去掉`i.date`后能够收敛,可能是因为减少了模型的复杂性,使得算法更容易找到解。

**解决策略**:

1. **简化模型**:尝试减少变量或交互项的数量,特别是当样本量相对较小而变量较多时。例如,可以先不考虑时间效应(即暂时不加`i.date`),或者尝试聚合一些相似的时间段以减少虚拟变量的个数。

2. **数据预处理**:检查是否存在异常值,并适当处理;对自变量进行标准化或中心化也可能有助于收敛。

3. **更改估计方法**:尝试不同的优化算法(如果软件支持)看是否能改善收敛性。或者考虑使用更稳健的方法,如Quasi-Poisson回归,它能够处理过度离散的问题而不需要假设误差项的特定分布。

4. **增加迭代次数或调整收敛标准**:有些情况下,可能需要更多的迭代才能达到收敛。当然,这也依赖于软件是否允许用户自定义这些参数。

关于你的最后一个问题:

- 对于计数型因变量,泊松回归和负二项回归是更合适的模型选择,因为它们能自然地处理非负整数值的分布特性。然而,在某些情况下,如果数据满足线性模型的基本假设(如正态性和同方差性),OLS回归可能仍然适用。但在实际应用中,计数数据通常不满足这些条件。

希望这些建议能够帮助你解决问题!

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-30 10:18