二、样本均值的分布
定理三:设总体X~ N(μ,σ2),(X1,X2,……Xn)是X的样本,则有:1. ,即N(μ,σ2/n) 2.
查表法:上百分位Zα, 下百分位Zα/2
三、 分布
1. 定义:设x1,……xn相互独立,且都服从N(0,1)分布,则RV 为服从参数(自由度,表示相互独立随机变量的个数)为n的 分布,记为 ~ (n)。
定理四: ,if y≥0; 0 其他。其中 , x>0。
2. 图形:
给定的n,n越小,其分布最大值(峰值)越靠近y轴。
1. 百分位点定义:给定α,(0<α<1),称满足 的点 (临界值)是自由度为n的 分布的上百分位点。
查表法:n≤45时直接查表。
2. n>45,n很大时,可以证明
证明: , , ,得到 ,可以查正态表。
3. 性质
(1)若 ~ , ~ ,并且 和 独立,则 + ~
(2)
(3)
定理五:设总体X~ N(μ,σ2),x1,……xn是子样,则:i, ;ii, 与s2相互独立;iii, 若已知s2 σ2统计量的分布可以用i。
样本均值分布:总体X ~ N(μ,σ2), ,
总体X~ N(0,1),X1,……Xn是样本子样,
, X~ N(μ,σ2), , 与s2独立。
四、t分布
定义2: 设X~ N(0,1), Y~ ,且X与Y相互独立,则称RV 是服从自由度为n的t分布。记为:T~ t(n)
定理: ,-∞<t<+∞
图形:以纵轴为对称轴的对称曲线。
当n>2时,E(T)=0,D(T)=n/(n-2)
给定α,称满足 的点 是t分布的上100α百分位点。n≤45时查表,n>45时,有 ≈Zα 。
当n很大,n>45时, ,t0.05(30)=1.6973, t0.01(25)=2.4851, t0.95(30)=- t0.05(30)=-1.6973
给定α(0<α<1),称满足 是t分布的双侧100α百分位点。
t0.05/2(15)=2.1315, 查表α/2即可。
二个定理
定理五:设总体X ~ N(μ,σ2),X1,……Xn是X的样本,则
证明:因为 , , ,
得到:
定理六:设X,Y相互独立,X ~ N(μ1,σ12),X1,……Xn1是样本,S12是样本方差。Y ~ N(μ2,σ22),Y1,……Yn2是样本,S22是样本方差。则,(1)若σ12 ,σ@2已知,则 ;(2)若σ12 ,σ@2未知,但是σ12 =σ@2 =σ2 ,则 。
证明:(1)X ~ N(μ1,σ12),Y ~ N(μ2,σ22), ,
, ,
即
(2) , , ,
,令 ,得到:
二、F分布
定义3:设X~ , Y~ , X,Y 相互独立,则称RV 服从自由度为(n1,n2)的F分布,记为 ,其中n1是第一自由度,n2是第二自由度。
图形:略。
给定α(0<α<1),称满足 的点 是F分布上的100α百分位点。当α表上有值时,直接查表,如F0.05(15,20)=2.2,F0.01(20,25)=2.7。表上没有α的查法。 表上没有,可以变换: ,
, ,所以 ,
得到 。
例如: ,
应用:设X ~ N(μ1,σ12),X1,……Xn1是样本,S12是样本方差。Y ~ N(μ2,σ22),Y1,……Yn2是样本,S22是样本方差。则有
证明: , , 。特别的,当σ12 =σ22,有
第七章 参数估计
需要用(X1,……Xn)估计EX DX;
已知X~ F(X,θ)类型,参数θ=(θ1,θ2,……θn)未知,用样本(X1,……Xn)估计θ。
上面两种统计问题叫做参数估计。参数估计有两方面的问题:一是通过样本对被估计参数θ合理地给出一个估计值,及 为θi的近代值,(i=1,2,……m),叫做点估计问题;二是通过样本找一个区间[ , ] 使它有一定的把握,包含未知参数θ,这叫区间估计问题,置信度是1-α。
参数点估计评选标准用统计置函数:
第一节 点估计
一、矩估计法(皮尔逊)
总体X,子样X1,……Xn, Xi与X同分布,并且相互独立。总体X有k阶原点矩。
子样的k阶原点矩: , k=1,2,……,分别表示1阶、2阶矩,……
当n很大时, ,k=1,2,……
或者Ak以概率1收敛于αk(n->∞),k=1,2,……
所以 , k=1,2……
若未知参数有m个,θ1,……,θm, 由 (方程组(1),含m个未知数) 可以得出 是θ1,θ2,……θm 的矩估计量(值),这是矩估计的一般方法。
常用矩估计法: (数字特征法)
证明:由方程组(1), (i), (ii)。由(i)得到 。
,得到
注:
用处:(1)总体分布不知道的情况下,从样本估计EX,DX
例1: 一批产品任取10个,得到样本值:(1,0,0,1,1,0,1,1,1,0),1=合格,0=不合格。求总体X的期望、方差的矩估计量。
,
(2)可以求出总体分布中未知参数的估计值
例2:总体X~ f(x,θ)=θx(θ-1) 当0<x<1时;0,其他。θ>0,是未知参数。(x1,……,xn)是子样,求θ的矩估计量。
例3:总体X~ B(m,p), m是正整数,0<p<1,(θ1,……,θm)是子样,求m,p的矩估计值。
E(X)=mp= , m= /p, D(X)=mp(1-p)=s2, 所以 (1-p)= s2,
注:
二、顺序统计量估计法
样本x1,……,xn从小到大排列, 称为顺序统计量。样本中位数 等于Xk+1,当n=2k+1时;(xk+xk+1)/2,当n=2k时。样本极差: , ,可以求D( )。
三、极大似然估计法
(一)基本思路(米歇尔)
例:王、李、张三人拔牙不痛的概率分别是90%,80%,60%,某人某人拔牙不痛,估计应该是王,因为其不痛的概率大。
例:袋中有黑白二色球,不知道多少,只知道两种球的数目比例为1:3,即抽到白球的概率为1/4或者3/4,要通过试验进行判断。如果是有放回抽样,从中抽取n个球,其中有X个黑球,总体X~ B(n,p), ,x=0,1,2,……n
p=黑球数/总数,若n=3,则有下表(p=1/4或者3/4)
X | 0 | 1 | 2 | 3 |
P(x,3/4) | 1/64 | 9/64 | 27/74 | 27/64 |
P(x,1/4) | 27/64 | 27/64 | 9/64 | 1/64 |
若抽3个球中,黑球数是0,有P(0,1/4)=27/64>P(0,3/4)=1/64,所以P=1/4的概率大些。
选取参数P的值,应该使所抽样本出现的概率最大,就用该值作为P的估计值,这种方法叫最大似然估计法。
一般,总体X~ f(X,θ),θ=(θ1,……θs)是位置参数,(x1,……xn)是子样(观察值),则Xi~ f(xi,θ),i=1,2……n, ,(x1,……xn)出现,说明它出现的概率应该最大。 应该最大,选取θ,取 最大, 就是θ的最大似然估计值,取
(二)定义:总体X~ f(X,θ1,……θt),(θ1,……θt)是未知参数,称 为样本(x1,……xn)的似然函数,若L在 达到最大值,称 是θ的最大似然估计量。
(三)步骤:设总体X~ f(xi,θ), Xi~ f(xi,θ),i=1,2,……,n,(1)写出似然函数 ;(2)取对数 ;(3) ,i=1,2,……s, 成为似然方程;(4)解出 ,讨论是否是唯一驻点,如果是则 是θ的最大似然估计值。
举例:
例1:设总体 。已知(x1,……xn)是样本,求λ的最大似然估计量。
解:写出似然函数:
取对数,并求参数的偏导数: ,
解出λ的似然值: , 是唯一驻点,所以是λ的极大似然估计量。
例2:总体X~ N(μ,σ2),求μ和σ2的极大似然估计量。
解:设(x1,……,xn)是X的样本观察值,X~ N(μ,σ2),得到 ,所以 ,
似然函数:
取对数,阶偏导数方程组:
,得到
带入方差偏导数公式。得到
例3:一大批产品随机抽取n件,发现m件次品,试用最大似然估计法估计次品率p。
总体X~ B(1,p),
X 0 1
P 1-p p
样本(X1,……, Xn)
X~ P(X=x)=f(x,p)=px(1-p)1-x, x=0,1
xi~ P(Xi=xi)=f(xi,p)=pxi(1-p)1-xi, xi=0,1
似然函数:
对数:
导数:
,
得到
性质:若 是θ的最大似然估计量, 是θ的连续函数,则 是 的极大似然估计量。
补充:设总体X~ B(N,p),(X1,……,Xn)是样本,已知N,求p的最大似然估计量。
已知一大批产品,每次从中抽取N=10个产品,共进行50次试验,将样本(X1,……,X50),统计表:
次品数 0 1 2 3 4 ≥5
频数 25 15 6 3 1 0
求该产品次品率P的最大似然估计值。
例4:总体X在[0,θ]上服从均匀分布,(x1,……,xn)是样本,求θ的最大似然估计。
解:X~ f(X)=1/θ, 0<x<θ。xi~ f(xi)=1/θ, 0<xi<θ, i=1,2,……,n
似然函数:
求对数并求导: ,常规方法无法解决,需要定义θ。
要L最大,需要 最大,当0<xi<θ时,L非零,所以 ,否则为0。
若 。
,有求极值法,求对数以后,求导求解。
X~ f(x,θ)=exp(-(x-θ)) if x>θ; 0, if x<θ。Xi~ f(xi,θ)=exp(-(x-θ)) if x>=θ; 0, if x<θ。 if Xi≥0; 0, 其他。求极值不能求解,只能用定义法。L最大,即 最小,又必须xi≥0,L非0,所以
定义法是一种常用的方法,条件是一般方法不能解决问题。
E(X)=μ, , 或者 这是对xi的加权平均。