楼主: 绅士
1108 4

[回归分析求助] 二分类数据集中于某一类别(e.g.,95%=1;5%=0),可以设置虚拟变量吗 [推广有奖]

  • 1关注
  • 2粉丝

已卖:224份资源

硕士生

51%

还不是VIP/贵宾

-

威望
0
论坛币
3977 个
通用积分
9.8604
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
536 点
帖子
41
精华
0
在线时间
287 小时
注册时间
2009-10-28
最后登录
2025-3-18

楼主
绅士 学生认证  发表于 2018-10-3 18:50:02 |AI写论文
20论坛币
请教计量大神。
我的一个样本中设置企业所有权性质变量(国有,外资,私有)。我想把私有作为baseline,但是国有=1的观测值只有2%(15/700)。但是均值检验和回归结果都是显著的。
想问下,这种情况设置的虚拟变量和计量结果是有意义的吗?
谢谢!

【看了几本书中没有找到相关的解释,我个人理解这样不太合适,但是又需要考虑这个分类的结果】

关键词:虚拟变量 分类数据 二分类 数据集 Baseline

沙发
绅士 学生认证  发表于 2018-10-3 20:01:25

藤椅
绅士 学生认证  发表于 2018-10-3 21:40:20
读到一篇类似文章,与大家讨论。【《经济研究》:公司诉讼风险、司法地方保护主义与企业创新】

作者研究诉讼风险时分了两组,第一组的回归有4998个obs,但是其中只有771个样本的自变量不为0,;第二组的回归中有4720个obs,但是其中只有40个样本的自变量不为0. 两组样本中使用了相同的对照组。
按照比例计算的话,第二组中的自变量波动不足1%(40/4720)。
如果上述理解没有错的话,文章发在《经济研究》上。

板凳
黃河泉 在职认证  发表于 2018-10-4 07:10:28
绅士 发表于 2018-10-3 21:40
读到一篇类似文章,与大家讨论。【《经济研究》:公司诉讼风险、司法地方保护主义与企业创新】

作者研究 ...
不错哦,能够"引经据典",我认为还是可以做的!

报纸
绅士 学生认证  发表于 2018-10-4 16:15:04
黃河泉 发表于 2018-10-4 07:10
不错哦,能够"引经据典",我认为还是可以做的!
感谢回复,在论坛中学习过好多您发表的讨论~~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 10:39