楼主: satellite111
13667 9

[原创博文] 逻辑回归0和1样本量相差悬殊怎么办 [推广有奖]

  • 0关注
  • 0粉丝

大专生

68%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
484 点
帖子
43
精华
0
在线时间
38 小时
注册时间
2009-6-21
最后登录
2015-9-20

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
做二元逻辑回归模型的时候
如果样本量应变量0和1很不对称
比如0有300来个,1有3000来个
会不会影响预测的结果
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:逻辑回归 怎么办 样本量 二元逻辑回归 逻辑回归模型 模型 影响

沙发
realgod5417 发表于 2011-1-27 08:49:08 |只看作者 |坛友微信交流群
如果发生或不发生的概率极小应用泊松回归(poisson regression), 不过你的300:3000=1:10还好一般logistic regeression 就行了
梅须逊雪三分白雪却输梅一段香

使用道具

藤椅
satellite111 发表于 2011-1-27 12:03:39 |只看作者 |坛友微信交流群
感谢ls的,但我试过,如果复制样本量少的数据,将0的数据增大
会影响分析结果

这个怎么办,要不要增大样本0的数据
因为我发现增大样本量后的结果比较符合我们对业务的分析,比较贴近实际

使用道具

板凳
smallflower 发表于 2011-1-28 14:12:40 |只看作者 |坛友微信交流群
比如做客户流失预警,正样本的数量过低的话,可以适当的减少负样本的数量。
还可以分别以1:5—1:10之间进行尝试!

使用道具

报纸
dd0627 发表于 2011-1-28 14:22:27 |只看作者 |坛友微信交流群
复制0样本的数据?这个不能做的,这相当于自己造数据改变样本,即使造的数据来自于与样本中的一部分,也是你有选择性的操作 3# satellite111

使用道具

地板
satellite111 发表于 2011-1-30 23:29:13 |只看作者 |坛友微信交流群
复制0样本的数据不行的话?

那么上面提的减少1样本的方法不知可行否
要不模拟0样本的数据?

使用道具

7
bobguy 发表于 2011-2-3 05:10:20 |只看作者 |坛友微信交流群
satellite111 发表于 2011-1-26 16:08
做二元逻辑回归模型的时候
如果样本量应变量0和1很不对称
比如0有300来个,1有3000来个
会不会影响预测的结果
No. You don't need worry about it with odd-ratio  1/10.

使用道具

8
Crystal24 发表于 2019-12-12 22:07:13 |只看作者 |坛友微信交流群
bobguy 发表于 2011-2-3 05:10
No. You don't need worry about it with odd-ratio  1/10.
大佬请问一下~这个有文献支撑吗?求文献

使用道具

9
shadowaver 在职认证  发表于 2021-7-6 10:50:53 |只看作者 |坛友微信交流群
商业应用中 要做样本调和的,主要目的是增大正响应记录的比重

使用道具

10
baobao220 在职认证  发表于 2021-7-15 17:23:42 |只看作者 |坛友微信交流群
1%的比率你还担心什么,0.1%才需要担心。
若样本率过小有几种简单方法
1. 减小非目标样本:按时间分布,等比例随机剔除非目标样本。
2. 增加目标样本:给坏样本增加权重。
3.扩大目标样本的定义范围
复杂一点可以做AGB/KGB扩展样本容量,还有其他更复杂的算法我就不献丑了。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 11:53