这两个模型都是一样的道理,根本区别是LOGIT假设残差项是STANDARD LOGISTIC分布, 而PROBIT假设残差项是标准正态分布。
这两个模型研究的就是参与(1),与不参与(0)这一类的二择一模型。 这样的话,被解释变量的值域只有两个值,或者是一(参与)或者是零(不参与)。 而我们感兴趣的是给定某个人的一些相关特点(解释变量), 那么它参与某个事件的概率是多少? 如果用古典的直线性回归分析的话,值域会是负无穷与正无穷之间,但是概率应该再零与一之间。所以人们用LOGIT或PROBIT这一类(S 型曲线,值域(就是CDF, CUMMULATIVE DENSITY FUNCTION)是零与一之间)模型来估计。 比如说是PROBIT;
Yi=1 if Yi*>0, Yi*=Xi(beta)+ei
Yi=0 otherwise.
这里残差项ei-N(0,1),即标准正态分布。 (注,如果LOGIT 的话, ei属于标准LOGISTIC 分布, 就是L(0,派的平方除以3))。
那么
Probability(Yi=1|Xi)=P(Yi*>0|Xi)
=P(ei>-Xi(beta)) 因为正态分布PDF是对称的, 所以
=P(ei<Xi(beta))
=F(Xi(beta)), F(。)是标准正态分布的CDF。
可以用最大似然法来估计参数beta, 后来可以研究Xi变化对于P(Yi=1)的影响(MARGINAL EFFECT FOR Xi CONTINUOUS, AND AVERAGE EFFECT WHEN Xi IS DUMMY VARIABLE)。。。