|
现在让我们假设我们有一组计数数据,我们希望对其进行分布,并且我们已经确定其中一个(a、b、0)分布比其他分布更合适。由于如果我们允许其参数取任何允许值,其中每一个都会形成一类分布,因此仍然需要确定手头数据的参数的最佳值。这是a40第2章。最大似然频率模型通常会产生有效的估计量。在本节中,我们将描述这种范式并推导最大似然估计(MLE)。假设我们观察到iid随机变量X,X,xn来自pmfpθ的分布,其中θ是Θ中的未知值 Rd.例如,在泊松分布pθ(x)=e的情况下-θθxx!,x=0,1,Θ=(0,∞). 在二项分布的情况下,我们有pθ(x)=mx公司qx(1- q) m级-x、 x=0,1,m、 θ:=(m,q)∈ {,,, . . .} ×(0,1).让我们假设观测值为x,…,xn;在这种情况下,从pθequalsnYi=1pθ(xi)观测该样本的可能性。Lθ依赖于数据,强调我们将其视为参数的函数。例如,在泊松分布的情况下,我们有l(λ)=e-nλλPni=1xinYi=1xi!!-1.在二项分布的情况下,我们haveL(m,q)=nYi=1mxi公司!qPni=1xi(1- q) 纳米-Pni=1xi。θ的最大似然估计量(mle)是似然的任何最大化子;在某种意义上,最大似然估计选择了最能解释观测结果的参数值。考虑来自aBernoulli分布(m=1的二项式)的3号样本,其值为0,0。这种情况下的可能性很容易检查为等式(q)=q(1- q) ,图2.1给出了可能性图。
|