楼主: kerryla
17540 14

[回归分析求助] 求助:因变量为百分比,使用ols回归是否正确? [推广有奖]

  • 1关注
  • 1粉丝

已卖:4份资源

博士生

28%

还不是VIP/贵宾

-

威望
0
论坛币
208 个
通用积分
0.0782
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
229 点
帖子
15
精华
0
在线时间
530 小时
注册时间
2015-2-10
最后登录
2025-1-8

楼主
kerryla 学生认证  发表于 2019-4-20 17:21:51 |AI写论文
20论坛币
求助贴:当因变量为百分比时,比值从0%至100%,即0至1,在回归时,使用OLS回归是否正确呢?
看到一些使用DEA效率作为因变量时,写到:由于数据区间为0至1,因此采用截断回归,或者tobit回归。
可是截断回归和tobit回归书上写的是由于数据受限。
事实上,感觉百分比好像并不存在数据受限的问题。

最佳答案

蓝色 查看完整内容

stata15有命令 [R] fracreg -- Fractional response regression Description fracreg fits a fractional response model for a dependent variable that is greater than or equal to 0 and less than or equal to 1. It uses a probit, logit, or heteroskedastic probit model for the conditional mean. These models are often used for outcomes such as rates, proportions, and fraction ...
关键词:百分比 因变量 问题。 计量经济学

沙发
蓝色 发表于 2019-4-20 17:21:52
stata15有命令

[R] fracreg -- Fractional response regression

Description

    fracreg fits a fractional response model for a dependent variable that is
    greater than or equal to 0 and less than or equal to 1.  It uses a probit,
    logit, or heteroskedastic probit model for the conditional mean. These
    models are often used for outcomes such as rates, proportions, and
    fractional data.




[R] betareg -- Beta regression
               (View complete PDF manual entry)


Description

    betareg estimates the parameters of a beta regression model.  This model
    accommodates dependent variables that are greater than 0 and less than 1,
    such as rates, proportions, and fractional data.

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
Sunknownay + 3 + 3 + 3 精彩帖子

总评分: 学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

藤椅
jonathan821 发表于 2019-4-20 18:37:06
这属于受限因变量回归,常用的是probit模型或logit模型,要根据你具体数据的类型来决定。

板凳
资源搬运工 发表于 2019-4-20 20:35:02
建议考虑进行归并回归,常用的tobit回归。但诚如您所言到底能否使用OLS来估计,亦或作为普通短面板数据处理,这个真不好说,因为这在发表的论文中经常会遇到。祝好。

报纸
kerryla 学生认证  发表于 2019-4-23 20:58:52
jonathan821 发表于 2019-4-20 18:37
这属于受限因变量回归,常用的是probit模型或logit模型,要根据你具体数据的类型来决定。
您好,还想多问一句。
1.我所理解的受限数据是指原始数据有一部分没有统计到,比如,统计局只统计规模以上企业的经济数据。事实上,规模以下企业的数据是存在的,只不过统计局没有统计。
2.我的数据 A=B/(B+C) ,这个数是一个百分比,变化区间为0%-100%
3. 现在的问题是,我的数据A都是有被统计到的,都是存在的(和第1条中的情况不同),当数据A为0%时,只是因为B=0,当数据A为100%时,只是因为C=0。但是,在统计时,B和C它们就是0,并不是没有统计到,存在数据缺失。这种情况下,我又觉得好像并不是受限数据,数据都被统计到了,只不过是变成了百分比的形式。我十分疑虑,这样到底应是用OLS,还是Tobit.
十分渴望得到您的解答,给予最真诚的问候。谢谢。

地板
jonathan821 发表于 2019-4-23 21:45:30
kerryla 发表于 2019-4-23 20:58
您好,还想多问一句。
1.我所理解的受限数据是指原始数据有一部分没有统计到,比如,统计局只统计规模以 ...
受限因变量模型有好多种情况,比如因变量是删失和截断情况、计数数据情况、有排序情况、离散选择情况等等……一般不使用OLS回归,因为所得估计不是consistent的……
针对您所列的第一种情况,规下的企业没有统计数据,如果考查的是所有企业情况,应该使用TOBIT模型……

至于您数据的具体情况,我的建议是作个变换,比如A=Z/(1+Z)其中Z=B/C,再看Z的变化区间……(但我不知道您数据中B和C的取值范围(都是大于零的吗?)……)如果知道A表示的意义,更容易处理……

7
kerryla 学生认证  发表于 2019-4-24 00:12:25
jonathan821 发表于 2019-4-23 21:45
受限因变量模型有好多种情况,比如因变量是删失和截断情况、计数数据情况、有排序情况、离散选择情况等等 ...
您好,我的数据是 企业的环境创新活动=环境专利申请量/企业专利申请总量。
企业的专利申请量都有统计到,是0的话就是没有申请,不存在数据缺失情况。
还是应当运用tobit模型是吗?

8
jonathan821 发表于 2019-4-24 18:15:04
kerryla 发表于 2019-4-24 00:12
您好,我的数据是 企业的环境创新活动=环境专利申请量/企业专利申请总量。
企业的专利申请量都有统计到, ...
这样的话,建议使用PROBIT或LOGIT模型,因为您的因变量是[0,1]之间的数值,作PREDICTION才有意义……

9
kerryla 学生认证  发表于 2019-4-24 19:34:02
jonathan821 发表于 2019-4-24 18:15
这样的话,建议使用PROBIT或LOGIT模型,因为您的因变量是[0,1]之间的数值,作PREDICTION才有意义……[em2 ...
您好,logit回归和probit回归中,因变量是0或1,非0即1,和我的因变量数据不同吧。我的因变量数据是0%至100%,在0-1的区间内,但是并不是非0即1的呢。

10
jonathan821 发表于 2019-4-24 22:46:34
kerryla 发表于 2019-4-24 19:34
您好,logit回归和probit回归中,因变量是0或1,非0即1,和我的因变量数据不同吧。我的因变量数据是0%至1 ...
嗯嗯,差点儿忘记了……PROBIT或LOGIT是二元因变量的情况……我只是担心您的因变量取值在[0,1],如果用OLS估计,超出这个范围不好解释……

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 12:15