95%可信区间的定义可能大家都很熟悉,但如何去解释单次试验的95%可信区间却困扰了我很久。
首先来看下95%可信区间的定义:
如果计算95%可信区间的过程无数次地进行的话,那么得到的95%可信区间中将有95%次覆盖了参数的真实值。
If the procedure for computing a 95%confidence interval is used over and over, 95% of the time the interval willcontain the true parameter value.
但是在实际当中,我们并没有去做无数次的试验(模拟除外),只是做那么一次,仅得到一个95%可信区间。
对于这个单次试验的95%可信区间,很多人就很直观地理解为:这个区间有95%的可能性覆盖了参数的真实值。
这种理解或许并不是正确的。
因为单次试验的95%可信区间要么覆盖,要么不覆盖参数的真实值(因此,覆盖的概率为1或0)。然而,你有的是95%的可能性去构造一个新的95%可信区间(这个可信区间同样为覆盖或不覆盖参数的真实值)。这就好比,在抛硬币的试验当中,你有50%的可能性得到正面,一旦你抛这个硬币,你就会有可能得到正面或反面。
所以,你有的是95%的可能性去构造一个覆盖参数真实值的95%可信区间。一旦你这样做了之后,你得到的95%可信区间同样是要么覆盖,要么不覆盖参数的真实值。
以上的理解均不一定正确,欢迎有兴趣的大牛们踊跃地发表高见。