1、假设检验就是根据备择假设构造一个拒绝域。而构造拒绝域是利用检验统计量的观察值与此统计量分布的某一分位点所形成的一个关系式决定的。而分位点与显著性水平有关。因而显著性水平(控制犯第一类错误的概率)的大小会影响决策者的判断。这里给出的 P-值是在原假设为真的条件下某一统计量的取值以其观察值为最小值或最大值的事件的小概率,或说某一统计量的取值以其观察值为最小值或最大值是一个小概率事件,此小概率就是 P。
也就是说假设检验是数理统计学中根据一定假设条件(何种统计量、样本容量)由样本推断总体的一种方法。
1.1、P-值定义:在一个假设检验问题中,利用观测值能够做出拒绝原假设的最小显著性水平称为 P-值。对于 P-值的理解,一般情况下有这几种认识:
(1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
(2) 拒绝原假设的最小显著性水平。
(3) 观察到的(实例的) 显著性水平。
(4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
(5) P-值是我们拒绝原假设的犯的最小的第一类错误,而显著性水平是事先给定的犯第一类错误的最大错误,具有主观性。因而运用 P 值进行决策是更为符合实际的。
2、选择显著性水平时应该考虑两类错误,如果第一类错误造成的损失比第二类错误的损失更小,则应使第一类错误出现的概率更高是合理的;但是第一类错误发生的概率应比第二类错误发生的概率高多少, 或低多少,只能决定于两者造成的期望损失总和,必须在计算不同概率组合下总损失的条件下, 然后对比分析, 选择期望总损失最小的那一组概率或对应的显著性水平作为检验的标准。
3、如何选择显著性水平,通常可根据可靠性的要求而取 0.01、0.05、0.1、0.2、0.5 等等,同时要选择适当的样本容量,使之符合给定的 α 及 β 值。
4、统计软件的逻辑:在统计量、样本容量确定的条件下计算出sig(p值,实际的显著性水平),与我们自己在研究设计中确定下来的理想的显著性对比,然后取出接受还是拒绝
5、认为显著性水平 α 并不是取的越小越好,在今天利用计算机和统计软件进行假设检验,总要计算一个“假设检验的 p 值”,利用 p 值可以判断原设定的 α 值下的假设检验是不是值得保留。并通过例子说明显著性水平不要拘泥于传统意义上的 0.01、0.05 等。
参考《统计假设检验中显著性水平的选择_王创》
|