楼主: zhanglin8562
6908 6

probit模型的样本量问题 [推广有奖]

  • 10关注
  • 1粉丝

已卖:1份资源

硕士生

33%

还不是VIP/贵宾

-

威望
0
论坛币
3095 个
通用积分
0
学术水平
0 点
热心指数
3 点
信用等级
0 点
经验
539 点
帖子
36
精华
0
在线时间
251 小时
注册时间
2007-10-30
最后登录
2017-7-20

楼主
zhanglin8562 发表于 2011-11-3 18:42:01 |AI写论文
20论坛币
我想分析女性的婚姻决策问题,分析什么因素影响女性选择结婚或者不结婚。我现在遇到的问题是,2000个样本中,Y变量取1的样本有1950个,取0的样本有50个,即未婚的只有50个,剩下1950个都是结婚的,两类样本数量差别很大。不知道在这种情况下运用二元probit模型是否合适?
如果不合适的话,有什么方法解决吗?另外,二元probit模型中取0和取1的样本比例大概为多少是合适的?
请大家赐教!

最佳答案

Mayonnaise 查看完整内容

zero inflated probit
关键词:Probit bit Rob 样本量 影响女性 模型

回帖推荐

zmn123452700 发表于3楼  查看完整内容

似乎不太合适 看看你的样本 是不是年龄都比较大? 增加点样本吧 哈哈 增加一些18岁以下的样本 我敢保证未婚的比较多(偏远农村可能例外) 要不,你的题目就叫 大龄女青年婚姻决策问题 这样人口特征统计的研究没做过也没什么意思 只能统计描述给人娱乐的 对政策指导上没什么用处 虽然,没有研究具体数据,但是结果差不多都可以猜测出来,决定女性是否结婚的最大因素是年龄 “待价”和“待嫁”还是比较少的,这样的样 ...

本帖被以下文库推荐

沙发
Mayonnaise 发表于 2011-11-3 18:42:02
zero inflated probit

藤椅
zmn123452700 发表于 2011-11-3 19:11:29
似乎不太合适
看看你的样本
是不是年龄都比较大?
增加点样本吧
哈哈 增加一些18岁以下的样本
我敢保证未婚的比较多(偏远农村可能例外)

要不,你的题目就叫 大龄女青年婚姻决策问题
这样人口特征统计的研究没做过也没什么意思
只能统计描述给人娱乐的
对政策指导上没什么用处

虽然,没有研究具体数据,但是结果差不多都可以猜测出来,决定女性是否结婚的最大因素是年龄
“待价”和“待嫁”还是比较少的,这样的样本你可能也收集不到
搞个数理模型比计量模型要有趣得多

另外,研究女性是否决策生孩子,生几个孩子也不错 嘿嘿

已有 1 人评分热心指数 收起 理由
zhanglin8562 + 1 热心指导我的问题

总评分: 热心指数 + 1   查看全部评分

板凳
zhanglin8562 发表于 2011-11-3 20:03:13
zmn123452700 发表于 2011-11-3 19:11
似乎不太合适
看看你的样本
是不是年龄都比较大?
非常感谢您,的确让我对研究的问题清楚了不少。
目前困惑我的主要问题是,50个未婚的样本,1950个结婚的样本,这么大的样本差是否用probit模型是合适的?如果不合适,为什么呢?请您多指教啊O(∩_∩)O~

报纸
zmn123452700 发表于 2011-11-3 23:52:13
zhanglin8562 发表于 2011-11-3 20:03
非常感谢您,的确让我对研究的问题清楚了不少。
目前困惑我的主要问题是,50个未婚的样本,1950个结婚的 ...
不合适
原因很多,你可以简单地理解为小概率事件下的离散选择研究没有意义。
你现在的问题很可能是在抽样上出了问题。
比例没有固定限制,如果年龄分布正常的话,0.7-0.8是可以的。
不知道你怎么调查的,调查哪些人,结婚的接近0.98了!

地板
木子小昔 发表于 2012-1-21 11:44:24
确实不太 合适。你这个叫类别不平衡,而且不平很的程度太大了。
另外,我们处理不平衡的样本有bagging,boosting等等方法,过抽样也是,你可以搜搜看

7
啦啦初 发表于 2016-11-23 15:25:00
木子小昔 发表于 2012-1-21 11:44
确实不太 合适。你这个叫类别不平衡,而且不平很的程度太大了。
另外,我们处理不平衡的样本有bagging,boo ...
您好,我想问一下,多元probit模型数据量为Y取1的样本为200,去2的为30,取3的为20,取4的15,这样可以吗??谢谢

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 11:45