楼主: lizhewenbei
2168 4

请教大神:为何我的logistic模型拟合值yhat(标签:估计概率)基本都大于50%呢? [推广有奖]

  • 15关注
  • 5粉丝

已卖:668份资源

副教授

38%

还不是VIP/贵宾

-

威望
0
论坛币
304 个
通用积分
11.3270
学术水平
4 点
热心指数
13 点
信用等级
5 点
经验
9728 点
帖子
614
精华
0
在线时间
502 小时
注册时间
2008-2-6
最后登录
2025-11-27

楼主
lizhewenbei 学生认证  发表于 2015-2-5 16:12:43 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教大神:
        为何我的logistic模型拟合值yhat(标签:估计概率)基本都大于50%呢?
        我有710个样本,其中被解释变量取1的为500家,取0的为210家。模型的ADJ.R2为20.5%。
        我在模型后面添加了“output out=est p=yhat”,没想到估计概率(yhat)基本都大于50%,也就是说,基本上全部样本都认为“事件会发生(取值为1)”
       这科学吗?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Logistic模型 logistic ogistic logisti logist 标签 模型 样本

沙发
bridge1989 发表于 2015-2-5 20:00:56
估计概率不能和50%直接比较吧

藤椅
lizhewenbei 学生认证  发表于 2015-2-5 22:49:27
bridge1989 发表于 2015-2-5 20:00
估计概率不能和50%直接比较吧
请问那该如何人工判断划归哪一拨呢?根据拟合的模型,我们应当要对原始数据有所判断啊

板凳
jingju11 发表于 2015-2-6 12:11:09
Yeah. It is more likely to be an event than being a non-event from your results.
We send mails to customers for asking credit cards application. The response rate is < 5%.  In a logistic model, the best prediction for almost all customers is always a non-response (event =0). On the other hand, we do see some groups are more tended to apply cards than others (OR >1). That is what we had learned from wasting so many junk mails.
JingJu
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
lizhewenbei + 1 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 1  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

报纸
lizhewenbei 学生认证  发表于 2015-2-6 15:11:23
jingju11 发表于 2015-2-6 12:11
Yeah. It is more likely to be an event than being a non-event from your results.
We send mails to  ...
非常感谢!您样本中,大多数人不愿意申请信用卡(0很多),极少数人愿意申请信用卡(1很少)。拟合logistic模型后,如果我们将该模型适用于您的这个原始样本(而不是另一个群组),会出现什么样的情况呢?应当大多数样本被判定为“愿意申请信用卡(事件1)”的概率低于50%吧?但是我的这个情况更为奇怪,原始样本的1约占70%,0约占30%,然而回归模型判识几乎98%的样本应当发生事件(估计概率大于50%),请问这种情况是否正常?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-20 17:19