楼主: kerryla
17543 14

[回归分析求助] 求助:因变量为百分比,使用ols回归是否正确? [推广有奖]

11
jonathan821 发表于 2019-4-25 15:18:40
kerryla 发表于 2019-4-24 19:34
您好,logit回归和probit回归中,因变量是0或1,非0即1,和我的因变量数据不同吧。我的因变量数据是0%至1 ...
那就按2楼的方法来估计,使用
  1. fracreg
复制代码
或者
  1. betareg
复制代码

12
jonathan821 发表于 2019-4-25 15:19:59
kerryla 发表于 2019-4-24 19:34
您好,logit回归和probit回归中,因变量是0或1,非0即1,和我的因变量数据不同吧。我的因变量数据是0%至1 ...
按您变量的定义,不适用于TOBIT模型……

13
木一清 发表于 2020-3-16 16:56:16
想问一下,我的因变量也是[0,1]的取值,表示的百分比,相关研究有直接用ols的也有用tobit的,用ols的话因为有部分为0或1,感觉残差分布什么的也不太好看,想问一下楼主最后选择了什么办法呢..

14
不爱读书的呆呆 发表于 2020-4-10 17:34:50
想问楼主这个问题解决了吗?我也遇到相似的情况,很困惑!

15
赵安豆 发表于 2024-11-26 20:19:01
当因变量是一个百分比或比例时(即值域在0到1之间),直接使用普通的最小二乘法(OLS)回归可能不是一个最佳选择。原因在于:

1. **线性假设问题**:OLS回归模型假定因变量与自变量之间的关系是线性的,并且因变量的残差(误差项)应该正态分布。然而,当因变量是一个比例时,这种线性假设可能会导致预测值超出0到1的合理范围。

2. **异方差问题**:百分比数据在接近0和1时,其变化的“空间”变小了,这可能导致数据点在这些区域的方差较小,在中间则较大。这种现象被称为异方差性(heteroskedasticity),会违反OLS回归的一个假设。

3. **限制性问题**:即使你说百分比似乎没有明确的数据受限问题,但实际上比例或百分比值被自然地限制在0到1之间。如果使用OLS,模型可能预测出这个范围之外的值,这是不合理的。

因此,对于这种数据类型,通常推荐使用适合于比例/百分比数据的方法:

- **Logit回归**:适用于因变量为二元(0或1)的情况,但可以扩展用于连续比例。
  
- **Probit回归**:与Logit类似,基于标准正态分布。

- **Beta回归**:专门设计来处理(0, 1)区间内的数据。如果数据包含确实的0和/或1值,则需要进行适当的数据转换或者使用零膨胀(zero-inflated)/一填充(one-inflated)模型。

至于你提到的截断回归(Truncated Regression)或Tobit模型,它们通常用于处理因变量的一部分被人为“截断”的情况。如果数据确实存在这样的问题,即观测值在某个阈值下丢失了信息,则使用这些方法是有道理的。然而,在比例/百分比的情况下,如果没有这种“截断”现象发生,采用Beta回归或类似模型可能更为适宜。

总之,选择哪种回归方法取决于你的具体数据和分析目的。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 14:19