楼主: hunxuexiaomeinv
1847 7

[词条] 一个Logit model 的问题 [推广有奖]

  • 0关注
  • 0粉丝

大专生

81%

还不是VIP/贵宾

-

威望
0
论坛币
708 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
3453 点
帖子
31
精华
0
在线时间
73 小时
注册时间
2010-7-27
最后登录
2022-4-27

楼主
hunxuexiaomeinv 发表于 2015-9-26 02:25:12 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我现在在做一个project研究alloy composition的实验结果,实验结果是一个binary variable PASS/FAIL。
现在我做了一个logit model,所有factor均是numerical variable。
现在我有一些问题想不明白。应为当任意一个factor为零的时候,possibility of PASS 应该是0,那么这时的log(p/1-p)就趋向于负无穷大,那么intercept就应该是负无穷大的一个值,但是这又是不可能的。
当然所有variable的定义域都是正数,不包括0。从这个角度来说也可以解释为在定义的那一段范围logit model可以使用。
我想请教一下,是否有更好的一些模型可以用来解释这个问题?比如randomforest 或者 SVM,又该如何解释上面我的问题。
谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:model logit mode del ODE factor 定义域 模型

本帖被以下文库推荐

yh

沙发
statax 发表于 2015-9-26 10:45:18
实际估计中被解释变量不是log(p/1-p),而是用的极大似然估计,楼主可以找本计量书看看,一般都在书的最后几章介绍离散选择模型的。

藤椅
hunxuexiaomeinv 发表于 2015-9-29 03:10:23
statax 发表于 2015-9-26 10:45
实际估计中被解释变量不是log(p/1-p),而是用的极大似然估计,楼主可以找本计量书看看,一般都在书的最后 ...
可以解释的清楚一点的嘛?首先被解释变量你说的是probability?还是linear result。前者是logisticmodel估计的possibility of event,而linear result也就是 log(odds)就是极大似然估计计算的。最后的我学的是统计,我不认为计量的书会比较好,但discriminant 的选择过程多是用bayesian method 而且我之前用的时候这个model在SAS中好像不会给系数的estimation。如果可以能否详细解释一下。

板凳
statax 发表于 2015-9-29 10:02:33
“所有factor均是numerical variable。
现在我有一些问题想不明白。应为当任意一个factor为零的时候,possibility of PASS 应该是0,那么这时的log(p/1-p)就趋向于负无穷大,那么intercept就应该是负无穷大的一个值”
--------------------------------------------------------

极大似然估计是直接估计y=f(beta*x), x 为你说的factor向量,f的函数形式为1/(1+exp(-beta*x)),所以任意factor为零时,不会影响估计。log(p/1-p)为对数似然比值,这个值与任意factor为零没什么关系,因为理论上p不会等于0或1。

报纸
hunxuexiaomeinv 发表于 2015-9-30 01:55:15
statax 发表于 2015-9-29 10:02
“所有factor均是numerical variable。
现在我有一些问题想不明白。应为当任意一个factor为零的时候,poss ...
我想你还是没有明白我的问题,我现在肯定的是当任意一个factor即xi为0的时候,the possibility for events is 0
。所以我才会有上诉的疑问,认为logit model在这种情况下并不能很好的诠释我的数据。而不是说极大似然估计的问题,最后你说的理论上p值不为0或1的问题,也正是我疑问的一个关键。所以我才会问是否有其他的模型可以解决这个问题。或者说不用考虑这个问题,因为定义域的限制不会取到0。既然你说的了discreminant的选择模型,我不是很熟悉,如果可以我想问一下这个模型可以解决我的问题吗?

地板
statax 发表于 2015-9-30 09:01:59
hunxuexiaomeinv 发表于 2015-9-30 01:55
我想你还是没有明白我的问题,我现在肯定的是当任意一个factor即xi为0的时候,the possibility for event ...
y=f(beta*x),f的函数形式为1/(1+exp(-beta*x)), 解释变量beta*x形式为beta0+beta1*factor1+....betak*factork, 显然,当某个factor为零时,y的概率不是零。即使只有一个factor,只要有常数项beta0,y的取值也不是0吧。
你说:“我现在肯定的是当任意一个factor即xi为0的时候,the possibility for events is 0”-------从何说起?

另外,可能你的问题在于没有区分实际取值和概率的关系。比如,抛一枚硬币,正反面朝上的概率都是0.5,现在你抛了三次,结果都是反面朝上,你不能说,取正的概率是0,因为正面从来没出现过。。。

7
hunxuexiaomeinv 发表于 2015-10-1 01:49:15
statax 发表于 2015-9-30 09:01
y=f(beta*x),f的函数形式为1/(1+exp(-beta*x)), 解释变量beta*x形式为beta0+beta1*factor1+....betak*fac ...
我确定为零的原因是这是一个工业设计,当alloy composition中任意一个元素的含量,也就是我的factor为0
时,所得的产品不可用于工业设计,级通过率为0。
也就是“我现在肯定的是当任意一个factor即xi为0的时候,the possibility for events is 0”
你说的都是理论上的东西,实际上的运用并不是这样。
所以我确定了当一个元素含量为零的时候,是不可以生产出合格产品的,也就是我确定了当任意factor为零的时候产品无法通过。
你只是在logitmodel上用数学来说明p不可以为0和1.这和我的问题本身没有关系。
有关系的是正如你所说我的数据本身的性质可能不适合logit model。我才想问是否有其他模型适合这个设计。
请不要再围绕logit model的数学问题上说了。
而且我最后也说了,任意factor为零是不可以的,因为工业生产上不允许。也就是定义域不可以为0.
而且最后的举例和我的问题也没有关系。
下面如果有什么建议,请针对我的问题,:
1,是否要考虑 “我现在肯定的是当任意一个factor即xi为0的时候,the possibility for events is 0”这个问题,因为定义域是不包含0的,因为我需要给我的professor这个建议。我希望可以解释这个问题。因为我现在和他说的是只考虑定义域范围的情况。
2,如果logit model存在问题,即不适合我研究的这个设计,那么是否有其他model合适。即可以解释 “我现在肯定的是当任意一个factor即xi为0的时候,the possibility for events is 0” 这个问题。

8
statax 发表于 2015-10-3 21:54:40
hunxuexiaomeinv 发表于 2015-10-1 01:49
我确定为零的原因是这是一个工业设计,当alloy composition中任意一个元素的含量,也就是我的factor为0
...
哦,看来我一直没理解你工业设计的模型,不清楚你的factor和the possiblity for events的关系啊,无能为力了。。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-4 01:19