1、假设检验作业
答:
a. 原假设u1=u2, 备择假设u1不等于u2
显著水平题目已知为Alpha=0.05
对两组独立样本进行T检验,得出
其中Pr( |T|>|t| )=0.0003,远远小于Alpha=0.05,所以需要拒绝原假设,即Bank1WaitingTime和 Bank2WaitingTime之间存在明显的差别。
b. P值是指在一个概率模型中,统计摘要(如两组样本均值差)与实际观测数据相同,或甚至更大这一事件发生的概率。是检验假设零假设成立或表现更严重的可能性。在本题(a)中的P值是Pr( |T|>|t| )=0.0003,与选定的显著性水平Alpha=0.05相比更小,所以零假设会被否定而不可接受。
c. 除了方差相等之外,(a)中还需要假设总体标准差rou已知,样本是成正态分布的双侧检验。
d.
在T检验的过程中,可以得出:
样本Bank1WaitingTime的均值为4.286667,标准误差为0.4229259,标准差为1.637985,95%的置信区间为(3.379581,5.193753)
样本Bank2WaitingTime的均值为7.114667,标准误差为0.537619,标准差为2.082189,95%的置信区间为(5.961589,8.267745)
对比两组样本的95%的置信区间范围,以及2*Pr(F<f) = 0.3800,小于Alpha=0.05,两个样本的波动情况存在不同,原假设u1=u2不同,所以需要拒绝原假设,即Bank1WaitingTime和 Bank2WaitingTime之间存在明显的差别
/*导入bank1和bank2的数据*/
import excel "C: .xlsx", sheet("DATA") firstrow clear
/*对Bank1和Bank2两组独立样本进行T检验*/
ttest Bank1WaitingTime == Bank2WaitingTime, unpaired
/*双样本方差的假设检验*/
sdtest Bank1WaitingTime == Bank2WaitingTime
2、five-year CDs
答:原假设u1=u2, 备择假设u1不等于u2
显著水平题目已知为Alpha=0.05
对两组独立样本进行T检验,得出
其中Pr( |T|>|t| )=0.6670,大于已知的显著水平Alpha=0.05,所以接收原假设,即在不同城市的收益率变化不存在差异。
/*导入数据*/
import excel "C: .xlsx", sheet("Data") firstrow clear
/*对纽约9家银行和洛杉矶9家银行两组独立样本进行T检验*/
ttest NY == LA, unpaired
3、
d. 原假设干细胞移植前骨髓微血管平均密度低于干细胞移植后u1<u2
备择假设干细胞移植前骨髓微血管平均密度高于干细胞移植后u1>u2
显著水平题目已知为Alpha=0.05
对两组独立样本进行T检验,得出
其中Pr( |T|>|t| )=0.1373,大于显著水平Alpha=0.05,所以接收原假设,即干细胞移植前骨髓微血管平均密度低于干细胞移植后。
e. 在本题(a)中的P值是Pr( |T|>|t| )=0.1373,与选定的显著性水平Alpha=0.05相比更大,所以零假设可接受。
c.在T检验的过程中,可以得出:
样本Before的均值为312.1429,标准误差为47.07614,标准差为124.5518,95%的置信区间为(196.9517, 427.334)
样本After的均值为226,标准误差为26.64851,标准差为70.50532,95%的置信区间为(160.7935, 291.2065)
对比两组样本的95%的置信区间范围,以及2*Pr(F<f) = 0.1919,大于Alpha=0.05,得出原假设可接受。
D. 需要做的假设包括:方差相等,假设rou已知,样本是成正态分布的双侧检验。
/*导入before和after的数据*/
import excel "C: .xlsx", sheet("DATA") firstrow clear
/*对before和after两组独立样本进行T检验*/
ttest Before == After, unpaired
/*双样本方差的假设检验*/
sdtest Before == After
4、
先导入原数据,使用describe和summarize, detail命令对数据进行描述,获得相关数据备用。
对Boston和Vermont两组独立样本进行T检验,得出
(a)和(b)
根据(a)的要求,将原数据中Boston的数据单独保存,导入
原假设boston=3150, 备择假设boston不等于3150
对Boston单一样本进行T检验,检验其是否显著等于3150
以上可知,共有368个有效样本参与了假设检验,样本的均值是3124.215,标准误差是1.80954,标准差是34.71299,95%的置信区间是(3120.656,3127.733),样本的t值是-14.2497,自由度是367,Pr( |T|>|t| )=0.0000,远小于0.05,需要拒绝原假设,即对Boston变量样本数据执行单一样本T检验的结果是显著不等于3150。
(c)和(d)
根据(c)的要求,将原数据中Vermont的数据单独保存,导入
原假设vermont=3700, 备择假设vermont不等于3700
对Vermont单一样本进行T检验,检验其是否显著等于3700
以上可知,共有330个有效样本参与了假设检验,样本的均值是3704.042,标准误差是2.57319,标准差是46.74432,95%的置信区间是(3698.98,3709.104),样本的t值是1.5710,自由度是329,Pr( |T|>|t| )=0.1171,大于0.05,需要接受原假设,即对Vermont变量样本数据执行单一样本T检验的结果是显著等于3700。
e. 单样本t检验的前提条件是样本的数据分布满足正态分布,因为在计算t统计量过程中需要用到均值和标准差,如果数据不满足正态分布,其统计出来的均值和标准差则没有意义,因此在进行单样本t检验之前首先要检验变量的正态性
通过绘制直方图,检验Boston数据的正态性
通过绘制直方图,检验Vermont数据的正态性
两组数据基本符合正态分布,可以进行单样本t检验。
/*导入Boston和Vermont的数据*/
import excel "C: .xlsx", sheet("DATA") firstrow clear
describe
summarize, detail
/*对Boston和Vermont两组独立样本进行T检验*/
ttest Boston == Vermont, unpaired
/*通过绘制直方图,检验Boston数据的正态性*/
histogram Boston
/*对Boston单一样本进行T检验*/
ttest Boston=3150
ttest Boston=3150, level(99)
/*通过绘制直方图,检验 Vermont数据的正态性*/
histogram Vermont
/*对Vermont单一样本进行T检验*/
ttest Vermont=3700
ttest Vermont=3700, level(99)


雷达卡


京公网安备 11010802022788号







