心理统计学试题及答案6套(94-96,01-03)
94年心理统计
一、单项选择题(共15分)
1. 当一组资料中有大或小的极端数值时,集中趋势宜用 ( B )
A 平均数 B mdn C M。 D 平均数和mdn
2. 在处理两类刺激实验结果时,系列哪种情况下只能用二项分布的公式直接计算?( C )
A n > 10 B n=10 C n<10 D n≥10
3. 在双因素实验的图中两条直线相交,说明有相互作用,但它是否显著,要看 ( C )
A Z检验结果 B a检验结果 C 方差分析的结果 D x2
4. 统计实验中常用的的两种显著性水平是
A .05与.02 B .10与.05 C .01与 .10 D .05与 .01 ( D )
5. 在41、71、52、48、35、35、41、82、72、56、59、73、60、55、41这组数据中,如果把它们转换成等级的话,35这个数的等级是 ( A )
A 14.5 B 13 C 14 D 1.5
6. 从样本推测总体,抽取样本必须是 ( D )
A 随便的 B 任意的 C 就近的 D 随机的
7. 已知一个分布的Q3=20,Q1=8,那么Q就等于 ( A )
A 6 B 14 C 12 D 13
8. 次数分布曲线图的横坐标代表各组资料的 ( B )
A 上限 B 中点 C 下限 D 平均值
9. 采用单侧或双侧检验是 ( A )
A 事先确定的 B 事后确定的 C 无所谓 D 计算后确定的
10. 已知平均数等于4.0,S=1.2 当x=6.4其相应的标准分数是 ( B )
A 2.4 B 2.0 C 5.2 D 1.3
11. 当全距很小的时候,说明这组资料 ( D )
A 分散 B 集中 C 非常分散 D 很集中
12. 从x推测Y或从Y推测X,在下列哪种情况下推测是没有误差 ( A )
A r=-1 B r=0 C r=+.98 D r=-.01
13. 已知某实验结果如下,平均数差D=5ms,n=1000,P<.0001,ω≤.01,说明这个实验效果 ( C )
A 很强 B 中等 C 很弱 D 较强
14. 如果一组数据中的每个数都相同,则S ( B )
A >0= B =0 C <0 D =0或<0
15. 当计算的集中趋势是平均数时,表示离中趋势要用 ( D )
A 全距 B 平均差 C 四分差 D 标准差
二、填空(每空2分,共30分)
1. 大样本和小样本的差别不是 ( 绝对的 ),一般来说n小于( 30 )时,称为小样本
2. x2是表示实际观察到的次数与假设次数( 偏离 )程度的指标
3. 当一种变量增加时,另( 一种 )变量却随着减少,说明这两种变量间有着(负相关 )
4. 样本平均数的可靠性和(样本)的大小成(正比)。
5. 样本平均数分布的标准差称为( 平均数的标准误)可根据样本的(标准差)来估计。P119
6. 心理统计方法是依(统计学)原理和(数学)方法在心理学领域中的运用。
7. 在掌握了两种变量的( 相关 )之后,从一种变量推测另一种变量时,需要进行(回归)分析。
8. 当平均数大于中数或( 众数 )时,曲线向( 右偏斜 )
9. 说平均数1和平均数2的差别显著是指这两个(样本 )可能是属于( 不同 )的总体。
10. 非参数分析只能从两个样本的比较中推测相应的( 总体 )在某方面大体是否(相 同)。
11. 在两类刺激实验中,实验也可以安排成三个一组,被试从三个里挑一个,这时p等于
( 1/3 ),q等于( 2/3 )
12. 从很多个样本计算出的( 很 多 )个平均数的次数分配叫(平均数的样本)分布。
13. 散布图可表示两种变量之间相关的( 性 质 )和( 程 度 ).
14. 中数是一系列按(大小)顺序排列的数据中(位置居中的那个数,它将数据分为大的一半小的一半)
15. 统计是一种( 方法 ),它要在(实验设计 )正确的前提下才能发挥充分。
三、名词解释(每个4分,共20分)
1. 众数:就是在数据中出现次数最多的那个数.使用它可以最快地了解数据的集中趋势,但它是一个较粗糙和极不稳定的指标.
2. 成功的概率(P):是指在实验中选对的概率。0<P<1,P(r)的公式在书中p130页
3.散布图:是用来了解和表示两列变量之间相互关系的图,通过散布图上数据点的分布形态,可以确定它们的关系是直线相关还是曲线相关,还可以观察它们相关的性质和相关的程度
4.集中趋势:是一组数据中具有代表性的指标.
5.两个样本平均数的差别显著:它是通过样本平均数差异的显著性检验得到的。两个样本平均数的差别显著,说明了该差别里不仅有抽样误差,还包含来自变量不同水平的影响。也就是两个总体存在差异。
四、简单应用题(15)
下表是两个年龄组被试的运动时(1/10秒)
被 试 | 一 二 三 四 五 六 | S |
青年 | 8 9 7 10 11 9 | 1.14 |
老年 | 16 19 20 15 18 18 | 1.86 |
1) 比较两组运动时的平均数
2) 分别计算各组的CV值
3) 说明哪一组平均数的代表性比较大,为什么?
解:1)青年组的平均数为:X1=∑x/n=54/6=9
老年组的平均数为:X2=∑x/n=106/6=17.7
2)青年组的离中系数:CV1=(S1/X1)×100=(1.14/9)×100=12.7
老年组的离中系数:CV2=(S2/X2)×100=(1.18/17.7)×100=6.7
3)答:老年组的平均数的代表性比较大,因为它的离散程度CV为6.7小于青年组的CV12.7。
五、应用题(20分)
随机选出青年男女各10人,两组镜画所用时间(秒)如下
|
女 男 | |
平均数 s | 98.0 112.0 12.0 15.0 |
1) 分别计算两组的SX(标准误)
2) 计算SXD
3) 计算t值和df值
4) 查表,根据P值说明镜画速度有无
显著的性别差异
解:首先提出虚无假设和备择假设:HO:μ1=μ2 HA:μ1≠μ2
1)女青年镜画平均数的标准误为: SX1= S1/√n =12.0/√10=3.8
男青年镜画平均数因的标准误为:SX2= S2/√n=15.0/√10=4.7
2)样本平均数差异的标准误为:SXD=√SX12+ SX22=√3.82+4.72=6
3)t= (X1-X2)/ SXD=(98.0-112.0)/6=-2.3
df=n1+n2-2=10+10-2=18
4)查表检验,因是被试间小样本设计要查t表,df=18。又因为是双侧检验。
得t分布双侧检验临界值为t.05/2(18)=2.10 t.01/2(18)=2.88
t-2.3<t.05/2(18)-2.10 或t2.3>t.05/2(18) 2.10 ,P<.05
结论:推翻虚无假设,男女青年镜画所用时间在.05的水平上显著性差异.且女青年要快于男青年.
一九九五年上半年北京市高等教育自学考试心理统计试题)
一、 单项选择题(第小题1分,共10分)
1、四分差越大,说明这组数据中间50%数据的分散程度( B )。
A越小 B越大C 与之无关D非常小
2、总体统计数落在样本平均数±2.58S 这个范围内的可能性有( C )。
A95%B68.23%C99%D98%
3、X,Y相关程度越高,从X预测Y的标准误就( B )
A越大B越小C中等D无变化
4从样本的统计量估计总体的参数的检验叫数( B )
A相关分析B参数分析C非参数分析D回归分析
5准确数是与实际完全相符的数据,如( D )
A刺激的强度 B 刺激的面积C 呈现的时间D被试的人数
6如果r=--.86,那么画出的散布图应该是( A )
A从左上至右下椭圆状B从左下至右上椭圆状C圆开从左上至右下直线
7如果我们要检验的两个大样本是相同成员在不同条件下得到的结果,须用( D )
A不相关,Z检测B不相关,t检验C相关,F检验D相关,Z检验
8样本平均数的可靠性和样本的大小( D )
A没有一定关系B成反比C没有关系D成正比
9.R76=30,说明在这个次数分布中,高于76的数据有( B )
A30%B70%C25%D24%
10对于X2值来说,其自由度决定于( B )
A观察数据的数目B观察数据的类别Cx2什D假设次数
二 填空题(每小题2分,共20分)
1当一种变量增加时,另一种( 变量 ) 也随着增加,说明这两者间有着(正相关的关系 )
2利用回归方程式进行预测时,一般仅限于原来观察(数据)的 ( 变动)的范围
3心理统计方法包括(描述)统计和(推论)统计两大部分.
4当1.96≤CR<2.58时,就可以认为两个X的差异在( 0.05 )水平上的显著.
5离中系数是用( 相对 )量来表示数据(分散)程度的指标.
6当总体不是正态分布时,而n较( 大 )时,样本分布仍趋于( 正态 )分布.
7积差相关系数是用两种变量的( Z)分数计算出来的,表示相关( 性质 )和程度的数字指标.
8数据分组以后,如果具有最多次数的两组被一个或( 几个 )次数较少的组分开,则画出的次数分布曲线就表现为(假双峰 )
9当两种变量间( 存在相关 )的关系时,两种变量间( 并不必然 )有因果关系
10直方图的纵坐标必须从( 0 )开始才能反映( 正确)的情况.
三名词解释题(每小题4分,共20分)
1从X推测Y的回归系数( byx):由x变量预测y变量的回归方程式的斜率。
2总体(举例说明) :研究对象的全部称为总体。总体的大小取决于研究者研究的范围和想说明的问题。比如我们研究6岁儿童的阅读能力。总体就是全世界6岁的儿童。
3第一个四分点(Q1):将一组数据从小到大排列,第一个四分点位于总体数据个数的四分之一处。
4单侧检验:它的特点是带有方向性的,它的否定区在分布的一端,因此它的.05、.01的临界值比双侧检验的小,大样本查正态分布表临界值为.05水平1.65;.01水平2.33。小样本根据df查t表
5标准分数:是以标准差为单位所表示的原始分数(x)与平均数的偏离,也可以说是一个以标准差为单位来表示的偏离分数。
四简单应用题(每小题15分,共30分)
1.已知二组测定反应时的实验结果如下:
组别 n X(ms) Z(或t ) P
甲 1000 197 3 <.01
乙 1000 198
(1) 能否说明甲乙二组的反应时有显著的差异?为什么?
(2) 计算w2值w2=(t2-1)/(t2+n1+n2-1)
(3) 根据这个实验结果应如何下结论?
解:(1)、不能说明甲乙二组的反应时有显著的差异。因为它存在着两个问题:
①、在统计检验中,Z值与SXD有着反比的关系参,也就是说Z值与样本大小(n)有着正比的关系。N越大,Z值越大,越容易达到显著水平。该题中的两个平均数的差异并不大。而得出的P<.01的结论,可能是N大而造成的假象。
②两个组的平均反应时仅差1ms,这个差值处在计时钟的误差范围内,很难令人承认这个平均数差异的精确度。
(2)、w2=(t2-1)/(t2+n1+n2-1)
=(32-1)/(32+1000+1000-1)
=.004<.01
(3)、根据实验结果的w2<.01,可认为这个实验的效果很差,即两组间平均反应时的差别与自变量的联系很弱。因此,原来只通过统计检验得到非常显著的结果是不可靠的。
2.10个被试的视觉和听觉反应时测定结果如下:
被试号 一 二 三 四 五 六 七 八 九 十
视觉RT(ms) 179 180 180 190 193 198 200 203 240 250
听觉RT(ms) 150 135 130 140 140 150 140 148 150 280
(1) 分别将两种反应时转换为等级数据;
(2) 两种反应时的等级相关系数rρ等于什么?提示:rρ=1-[6ΣD2/(n3-n)]
(3) 这两种反应时的相关性质和相关程度如何?结合本题具体条件说明rρ的含义。
解:(1)、被试号 一 二 三 四 五 六 七 八 九 十
视觉RT(ms) 179 180 180 190 193 198 200 203 240 250
听觉RT(ms) 150 135 130 140 140 150 140 148 150 280
R1 10 8.5 8.5 7 6 5 4 3 2 1
R2 3 9 10 7 7 3 7 5 3 1
D 7 -0.5 -1.5 0 -1 2 -3 -2 -1 0
D2 49 0.25 2.25 0 1 4 9 4 1 0
得ΣD2=70.5
(2)、rρ=1-[6ΣD2/(n3-n)]
=1-[6×70.5/(103-10)]
=0.57
(3)这两种反应时的相关性质为正相关,相关程度为0.57。说明了视觉与听觉的反应时具有中等强度的相关。
五、复杂应用题(20分)
某教员为了比较两种语文教学法,在小学四年级中随机选出两组被试,每组49人,两组的成绩(分)如下:
X S
第一组: 甲法 8.9 2.8
第二组: 乙法 10.2 2.1
(1) 分别计算各组的SX值;
(2) 计算SXD值;
(3) 算出Z值;
(4) 说明两种方法的成绩差异是否显著,显著水平如何?
解:首先提出虚无假设与备择假设: HO:μ1=μ2 HA:μ1≠μ2
(1)、第一组的样本平均数的标准误为:SX1= S1/√n=2.8/√49=0.4
第二组的样本平均数的标准误为:SX2= S2/√n=2.1√49=0.3
(2)、样本平均数差异的标准误为:SXD=√SX12+ SX22=√(0.4)2+(0.3)2=0.5
(3)、Z=(X1-X2)/ SXD=(8.9-10.2)/0.5=-2.6
查表检验,被试间大样本,应该查正态分布表。又因为是双侧检验,所以Z分布双侧检验的临界值为:Z.05/2=1.96 Z.01/2=2.56
Z-2.6<Z.01/2-2.56 或Z 2.6>Z.01/2 2.56 P<.01
(4)、结论:两种方法的成绩差异是显著的,显著水平的.01。
一九九六年上半年北京市高等教育自学考试心理统计试题
一、单项选择题(每小题1分,共10分)
1.6、8、10、12、26这一组数据的集中趋势宜用( B )
A.平均数 B中数 C众数 D平均数或中数
2.已知甲分布中,P-P=38,在乙分布中,P-P=24,两个分布的分散程度是( A )
A甲>乙 B甲=乙 C甲<乙 D甲≥乙
3.样本平均数和总体平均数相差不超过±1SX的可能性有( A )
A68.26% B95% C99% D34.12%
4.BXY是代表从Y预测X的( C )
A离中系数 B等级相关系数 C回归系数 D相关系数
5.计算分组数据中点的公式是:( C )
A(最大数值-最小数值)/2 B上限-(上限+下限)/2 C下限+(上限-下限)/2 D下限+(上限+下限)/2
6.r=+1时,散布图的形状是( D )
A两条直线 B 圆 C椭圆 D一条直线
7.在处理两类刺激实现结果时,在下列哪种情况下不可以用正态分布来表示二项分布的近似值?( A )
A n<10 B n≥10 C n>30 D n>10
8.下列哪个相关系数所反映的相关程度最大( D )
A r=+0.53 B r=-0.69 C r =+0.37 D r=-0.72
9.在一个次数分布中,在Q3以下的数据占总数据的( D )
A25% B50% C74.5%D 75%
10.一个Z分数分布的平均数永远等于( B )
A -1 B 0 C +1 D±1
二、 填空题(每小题2分,共20分)
1.当实验的数据有两组或(两组)以上,都是不连续的变量时,要检验各组间的差异是否显著用 。
2.若散布图中的所有点自坐标原点沿对角线从左下到右上散布,说明两个(变量)的相关为(完全正相关)。
3.数据分组以后,每一组所包含的各数据都要有一个(中点)。通常是以每一组的(中点)当作这一组中各数据的代表。
4.样本平均数的(可靠)性是和样本的(大小)成正比的。
5.当比较两个平均数的差异时,鉴定实验效果的两种指标是(0.01)和(0.05)
6.CV代表(离中)系数,它是表示一组数据分散程度的(数字)指标。
7.在其他条件(相同)的情况下,总体的离中趋势越大,则样本平均数的可靠性就(小) 。
8.当平均数大于中数或(众数)时,曲线(向右)偏斜。
9.用百分点和(百分)等级便于描述一个分布和(整体)数据之间的关系。
10.两个样本的平均数(差异)显著,是指这个差别远远超过由(抽样)误差造成的差别。
三、 名词解释题(每小题4分,共20分)
1. 组间变异:在两组之间所产生的因变量的变异,就是系统变异,也就是由自变量引起的变异。因
为这种变异发生在两组之间,所以又叫组间变异。
2. 负相关:在两列相关变量中,如果变量的变化方向是相反的,它们的关系表现为负相关。
3. 失败的概率Q(举例说明):在二项实验中,被试选错的概率,即做出错误反应的概率。例如: 考察被试是否有用嗅觉区分盐水与白水的能力,用10对杯子的实验设计中,每次给被试呈现盐 水和白水各一杯,要求他选一杯。这时他选错的概论q=1/2
4. 描述统计:把实验中得到的数据进行概括的整理,从中得到实验者有用的信息。描述统计的指标
有三类:数据的集中趋势,数据的离中趋势,数据间的相关。
5. 回归:当两种变量间存在着一定程度的相关时,一种变量有向另一种变量的平均数趋近的现象,
这种现象叫回归。
四、 简单应用题(每小题15分,共30分)
1. 某班五组学生共同参加一项测验,结果如下:
组别 n 测验分数
A 4 100 110 95 90
B 6 120 112 108 92 89 96
C 2 98 97
D 5 103 110 96 94 89
E 3 97 88 90
(1) 求出各组学生测验分数的平均数;
(2) 求出五组学生测验分数的总平均数XW;
(3) 说明本题为什么要计算加权平均数(XW);
解:(1)、X1=∑x1/n=395/4=98.8 X2=∑x2/n=617/6=102.8 X3=∑x3/n=195/2=97.5
X4=∑x4/n=492/5=98.4 X5=∑x5/n=275/3=91.7
(2)、XW=∑(nx)/∑n=1974/20=98.7
(3)本题计算加权平均数(XW),是因为数据n不等时各小组平均数所代表的数据个数不等。此时各小组平均数的意义对于总平均数就不同。因此在计算总平均时要考虑小组n权重,而采用加权的方法。
2.为了解生病对选择反应时(秒)的影响,某医生随机选了二组被试各5人,结果如下:
健康者 1 2 2 3 3
患者 3 3 4 5 5
(1) 分别计算二组的平均反应时;
(2) 完成下列A2S5方差分析
变异来源 df SS MS F P
A 1 8.1 8.1
S(A) 8 6.8 ─ ─
附: F值表(这里不打出来了,大家看后面03年的试卷上的吧,题目是一样的..)
(3) 根据上表中P值确定二组反应时的差异是否显著,并说明疾病与选择反应时的关系.
解:(1)、健康者的平均反应时:X1=∑x/n=11/5=2.2 方差S21=∑(x1-X1)2/n=0.56
患者的平均反应时:X1=∑x/n=20/5=4 方差S22=∑(x2-X2)2/n=0.79
(2)、 ①最大F检验:虚无假设:HO:σ21=σ22
计算最大F值:Fmax=S2max/S2min=0.79/0.56=1.34
检验:k=2,n-1=4。查最大Fmax检验表,得.05水平的临界值为9.60
Fmax1.34< Fmax.059.60 接受虚无假设,即:总体方差一致,适合进行方差分析。
②虚无假设和备择假设 HO:μ1=μ2;HA:两总体间存在差异。
③计算方差的准备数据:
计算数据总和:∑X=X1+X2+X3+……XN=31
计算数据平方和:∑X2= X21+ X22+ X23+……X2N=111
数据总个数N=10 小组数据个数n=5
④计算和方SS:
先计算I值:I=(∑X)2/N=96.1
然后计算总和方:SST=∑X2- I=111-96.1=14.9
计算组间和方:SSA=∑[(∑Xk)2/n]-I=(121+400)/5-96=8.1
计算组内和方:SSE=SST-SSA=14.9-8.1=6.8
⑤计算和方的自由度:
计算组间和方的自由度:dfA=A-1=2-1=1
计算组内和方的自由度:dfE=k(n-1)=2(5-1)=8
计算总自由度:dfT=N-1=10-1=9
⑥计算均方:
计算组间均方:MSA=SSA/dfA=8/1=8.1
计算组内均方:MSE=SSE/dfE=6.8/8=0.85
⑦计算F值:F=MSA/MSE=8.1/0.85=9.5
⑧方差分析表:
变异来源 df SS MS F P
A 1 8.1 8.1 9.5 <.05
S(A) 8 6.8 0.85
⑨F检验:组间df1=1,df2=8。查到F值F.05(1,8)5.32;F值F.01(1,8)11.26,得到的F值9.5大于.05的临界值5.32。因此在是一个在.05水平上显著的F值。
结论:因为P<.05,所以两组反应时在.05的水平上差异显著。患者的选择反应时比健康者要
说明了疾病使得反应时增长了。
五、 复杂应用题(20分)
为了解儿童识记汉字和图画的能力,在幼儿园随机选出81个测试,实验结果(保存量:个)如下:
汉字 图画
X 4.1 5.5
S 3.6 4.5 r=+.80
(1) 分别计算汉字和图画的SX;
(2) 计算SXD;
(3) 计算CR(或Z)值;
(4) 说明幼儿对汉字和图画记忆的保存量是否有显著差异
解:(1)、首先提出虚无假设与备择假设: HO:μ1=μ2 HA:μ1≠μ2
(1)、汉字的样本平均数的标准误为:SX1= S1/√n=3.6/√81=0.4
第二组的样本平均数的标准误为:SX2= S2/√n=4.5√81=0.5
(2)、样本平均数差异的标准误为:SXD=√SX12+ SX22-2r SX1 SX2
=√(0.4)2+(0.5)2-2×0.80×0.4×0.5=0.3
(3)、Z=(X1-X2)/ SXD=(4.1-5.5)/0.3=-4.7
查表检验,被试内大样本,应该查正态分布表。又因为是双侧检验,所以Z分布双侧检验的临界值为:Z.05/2=1.96 Z.01/2=2.56
Z-4.7<Z.01/2-2.56 或Z 4.7>Z.01/2 2.56 P<.01
(4)、结论:儿童识记汉字和图画的能力的差异是显著的,显著水平的.01。
2001心理统计试卷
一、单选题
1、 为了解某个数值以下的数据数目是多少,需要制作( C )
A、次数分布表 B、次数分布图
C、累加次数分布表 D、累加次数百分数的分布表
2、7.7.8.9.10.11.12在这一组数据中,比中数大的数据数目是( A )
A、3 B、3.5
C、4 D、4.5
3、当一个次数分布向左偏斜时( A )
A、X<mdn C、X>mdn
C、X=mdn D、X≤mdn
4、有时实验结果的次数分布图上会出现双峰,产生真正的双峰的原因是( B )
A、数据差别过大 B、数据的性质不同
C、分组的组距不合适 D、数据过于集中
5、已知某班学生的反应时分布的Q1=180ms,即有25%的人的反应时比180ms( A )
A、短 B、相等
C、长 D、接近相等
6、决定正态分布曲线的最高点在横轴上确切位置的是( A )
A、m (即为新书中的μ) B、σ
C、N D、Z
7、在下列哪中情况下,求样本平数数分布的标准误须用自由度( C )
A、n=30 B、n>30
C、n<30 D、n<35
8、如果要检验一个平均数大于另一个平均数是否达到显著水平,须用( B )
A、双侧检验 B、单侧检验
C、双侧T检验 D、双侧检验和单侧检验
9、已知R甲=+1.00,R乙=-1.00,两种情况下回归预测准确性是( D )
A、甲>乙 B、甲<乙
C、甲=乙 D、没一定关系
10、某实验用被试20人,设置四种观察条件,得到了四种观察结果,其X2=8.74,自由度为( B )
A、4 B、3
C、18 D、19
二、填空题
1、当横坐标代表的变量不是连续的数量,而是不同的(类别)时,就只能画(直条)图。
2、把一个分布中较大的一半数据,再分成两半的那个(点)就是(第三个)四分点。
3、表示(集中)趋势适合用中数的情况下,表示离中趋势则宜用(四分差)。
4、散布图中各点如果都落在一条直线上,说明数据间有(完全)的(相关关系)。
5、样本平均数分布的标准差称作(平均数的标准误),可根据样本的--标准差---来估计。
6、虚无假设是假定要检验的两个(总体)平均数是(没有)真正差别的。
7、如果样本平均数之间的差异,由于抽样误差造成的(概率)较小,就可以认为总体平均数之间有(显著)的差异。
8、已知ê=.5y+2,当(Y)=120时,预测E的值为(62)。
9、在进行X2检验时,如果数据只有二组或df=(1),就需要进行(校正)。
10、方差是标准差的(平方)值,又叫均方或(变异)数。
三、 名词解释
1、 全距:一个分布中最大的数值的上限减去最小数值的下限,就得到全距。(全距大,说明这组数
据分散;全距小,则较集中。使用时注意:1、无极端值;2、比较两个分布的全距时,
当两个分布所包含数据的个数相等或差不多时才能使用)
2、 正态分布:是一个单峰曲线,中间高,两边逐渐下降,在正负一个标准差的地方有拐点,两端永
远不与横轴相交,两侧完全对称的钟形曲线。
3、显著性水平:我们所选择的推翻虚无假设的概率叫做检验的显著性水平。
4、交互作用:一个自变量对反应变量的影响因另一个自变量的变化而发生变化。当一个因素几个水平的效果在另一因素各水平上的变化趋势不致时,就称这两个因素存在着交互作用。
四、 简单应用题
1、下面是测定两组儿童食指两点阈(mm)的结果
被试号 一 二 三 四 五 六 S
盲童 3 1 1 2 2 2 0.75
正常儿童 6 4 7 3 4 5 1.47
(1) 分别计算各组两点阈的X和CV。
(2) 那一组儿童的食指分辨两点的能力较强?
(3) 那一组儿童的两点阈比较一致?为什么用CV而不用S比较?
解:(1)、盲童食指两点阈的平均数:X1=∑x1/n=11/6=1.8
盲童离中系数:CV=(S1/X1)×100=(0.75/1.8)×100=41.7
正常儿童食指两点阈的平均数:X2=∑x2/n=29/6=4.8
正常儿童离中系数:CV=(S2/X2)×100=(1.47/4.8)×100=30.6
(2) 盲童的食指分辨两点的能力较强。
(3) 正常儿童的两点阈比较一致。使用CV而不用S比较是因为两组的平均数和标准差差异较大,不宜直接比较。应转化为离中系数,用相对量来比较离散程度。
2、某工厂欲试行一改革方案,为了解群众意见,进行了随机抽样调查,结果120名职工中有79名赞同,根据这个结果能否说明全厂职工是赞同实施改革方案的?
(1) 先确定P和q值,再计算mp和Sp。
(2) 计算Z值
(3) 根据P值回答问题
解:虚无假设:全厂职工对实施改革方案没有偏好。
(1)职工的意见不是赞同就是不赞同。所以p=q=0.5
mp=np =60 Sp=(√npq) = √[(0.5)(0.5)/120]=5.48
(2)Zp=(Xo-mp)/Sp=[(78.5-60)/5.48] =3.38
(3)查正态分布表,因为现在要检验赞同实施改革方案的比例是否大于机遇,要用单检验。
当Z=2.33时P=0.01,而求得的Zp=3.38大于2.33所以可以在0.01的水平上推翻虚无假设
认为全厂职工对实施改革方案显著赞同.
3、已知二组测定反应时的实验结果如下:(与九五年的简单应用题第一题完全相同)
组别 n X(ms) Z(t) P
甲 1000 198 3 <.01
乙 1000 197
(1) 能否说明甲乙二组的反应时有显著差异?为什么?
(2) 计算ω2值(ω2=t2-1/t2+n1+n2-1)
(3) 根据这个实验结果应如何下结论?
解:(1)、不能说明甲乙二组的反应时有显著的差异。因为它存在着两个问题:
①、在统计检验中,Z值与SXD有着反比的关系参,也就是说Z值与样本大小(n)有着正比的关系。N越大,Z值越大,越容易达到显著水平。该题中的两个平均数的差异并不大。而得出的P<.01的结论,可能是N大而造成的假象。
②两个组的平均反应时仅差1ms,这个差值处在计时钟的误差范围内,很难令人承认这个平均数差异的精确度。
(2)、w2=(t2-1)/(t2+n1+n2-1)
=(32-1)/(32+1000+1000-1)
=.004<.01
(3)、根据实验结果的w2<.01,可认为这个实验的效果很差,即两组间平均反应时的差别与自变量的联系很弱。因此,原来只通过统计检验得到非常显著的结果是不可靠的
五、综合应用题
某研究兴趣在于早晚的记忆力是否有显著差异,随机抽选6名被试,请他们早晚背不同的英文单词.几天后检查结果如下: 附表T值表(这就不打出来了)
记忆保存量
1 2 3 4 5 6
早 6 5 6 8 9 4
晚 8 7 5 10 10 6
(1) 分别计算早晚保存量的平均数.
(2) 用简捷法计算T值.提示:T=XI-X2/√ΣХD-(ΣXD)2/n/n(n-1)
(3) 计算DF,并查表检验
(4) 根据P值回答问题
解:首先提出虚无假设与备择假设: HO:μ1=μ2 HA:μ1≠μ2
(1)、早晨的记忆保存量的平均数:X1=∑x1/n=38/6=6.3
晚上的记忆保存量的平均数:X2=∑x2/n=46/6=7.7
(2) 用简捷法计算T值.
记忆保存量
1 2 3 4 5 6
早 6 5 6 8 9 4
晚 8 7 5 10 10 6
XD -2 -2 1 -2 -1 -2
X2D 4 4 1 4 1 4
得∑XD =-8 ∑X2D =18
T=(X1-X2)/√[ΣX2D-(∑XD)2/n]/n(n-1)
=(6.3-7.7)/[18-64/6]/6×5
=-5.8
(3)检验df=n-1,6-1=5 根据df查t表,双侧检验df=5一行,临界值t.01/2(5)=4.032
(4) 、t-5.8<t.01/2(5) - 4.032 即t5.8>t.01/2(5) 4.032 P<.01
结论:推翻虚无假设,早晚记忆保存量在的.01水平上有显著差异。
八、设计题
用组间设计方法与组内设计方法分别设计实验,来测定视觉反应时和听觉反应时。(无标准答案,大家都做做看)
2002心理统计试卷
一、 单选
1、 157.5这个数的上限是( C )
A、158 B、157.75 C、157.55 D、158.5
2、 在比较两组平均数相差较大的数据的分散程度时,宜用( C )
A、全距 B、四分差 C、离中系数 D、标准差
3、 下列哪个相关系数所反映的相关程度最大( D )
A、r=+.53 B、r=-.69 C、r=+.37 D、r=-.72
4、 已知平均数=4.0,S=1.2,当X=6.4时,其相应的标准分数为( B )
A、2.4 B、2.0 C、5.2 D、1.3
5、 某班200人的考试成绩呈正态分布,其平均数=12,S=4分,成绩在8分和16分之间的人数占全部人数的( B )
A、34.13% B、68.26% C、90% D、95%
6、 样本平均数的可靠性和样本的大小( D )
A、没有一定关系 B、成反比 C、没有关系 D、成正比
7、 为了避免偏性估计,用来推测总体的样本应该是( C )
A任意抽选的B随意抽选的C随机抽选的D按原则抽选的
8、 XY两个变量间是正相关,R=.76,其回归是(B )
A似合的一条线B准确的两条线C确定的一条线D拟合的两条线
9、 在心理实验中,有时安排同一组被试在不同的条件下做实验,获得的两组数据是( A)
A相关的B不相关的C不一定D一半相关,一半不相关
10、 双因素实验结果的方差分析有三种,组内设计、组间设计的和(A )
A混合设计的B单因素设计的C多因素设计的D多水平设计的
二、 填空
1、 当知道了几个数(个数不相等)的数据的平均数后,要计算这些平均数的总平均值应采用( 加权平均数 )的方法
2、 ( 集中 )趋势是说明(数据集中)趋势的代表性的统计量
3、 若散布图的所有点自坐标原点沿对角线从左下到右上散布,说明两个(变量间)的相关为( 完全正相关)
4、 把原始分数转换成标准分数是通过把各原始分数和(平均数)相减再用(标准差)去除来实现的
5、 统计推论中的第一类错误是把(随机)误差误认为是总体平均数的(真正)差异
6、 随机抽选样本,是指总体中每个成份都有(相等)的机会被( 选中)
7、 从总体中抽取出很多N相等的样本,计算出的(一)个样本平均数的次数分布,称为平均数的(样本)分布
8、 在两类刺激实验中,实验也可以安排成三个一组,被试从三个里挑一个,这时p等于(1/3),q等于(2/3)
9、 在双因素实验的结果图中两条直线平行,说明二因素对(因)变量的影响( 不存在)交互作用
10、 当两个平均数差异的显著性检验的结果是P=.06时,按习惯被认为是差异(不显著),此时如判定为差异显著,其可靠性等于(96%)
三、 名词
1、 大样本:心理统计里,规定n>30时为大样本,大样本查表用正态分布表。
2、 成功的概率:在二项实验中,被试选对的概率,即做出正确反应的概率。
3、 主效应:是指单一因素的不同水平对因变量的作用。检验单一因素各个水平的总体平均数有无显著性
差异,称为检验各因素的主效应。
4、 W2 :是自变量(X)和反应变量(Y)间联系的强度。(Y)随(X)变化的比例越大,这个实验的效
果就越大。
四、 简单应用
1、 某测验兴趣在研究空间位置的记忆能力的男女差别,分别抽取男女各8名被试的成绩如下:
被试 1 2 3 4 5 6 7 8
男 10 9 8 11 12 11 12 4
女 8 6 5 6 8 10 11 5
1) 分别计算男女分数的Q1、Q2、Q3
2) 比较男女两组的成绩
3) 比较男女两组的分散程度
解:
1)先把两列数据从小到大排列一下。
男:4 8 9 10 11 11 12 12
女:5 5 6 6 8 8 10 11
Q1位置:(n+1)/4=2.25
男:Q1处在第2.25的位置,即8和9之间:
Q1=8+0.25×(9-8)=8.25
女:Q1处在第2.25的位置,即5和6之间,
Q1=5+0.25×(6-5)=5.25
Q2位置:(n+1)/2= 4.5
男:Q2处在第4.5的位置,即10和11之间:
Q2=10+0. 5×(11-10)=10.5
女:Q2处在第4.5的位置,即6和8之间,
Q2=6+0. 5×(8-6)=7
Q3位置:3(n+1)/4= 6.75
男:Q3处在第6.75的位置,Q3=11+0.75×(12-11)=11.75
女:Q3处在第6.75的位置,Q3=8+0.75×(10-8)=9.5
2)比较两组的成绩用中数,即Q2: 因为男Q2:10.5>女Q2 :7.5
所以男被试的记忆成绩好于女被试的记忆成绩。
3)男被试的四分差Q=(Q3-Q1)/2=(11.75-8.25)/2=1.75
女被试的四分差Q=(Q3-Q1)/2=(9.5-5.25)/2=2.125
因为女被试的四分差大于男被试的四分差,所以女被试那组成绩离散程度大。2、 某班50名学生分别在学期初和学期末进行了两次测验,结果如下:
学期初测验:平均分=45.0分,S=6.0分
学期末测测:平均分=52.0分,S=7.2分,R=+.40
如果某学生学期初测验得60分,那么他学期末可能得多少分?
提示:
1) 计算回归系数B
2) 计算A,列回归方程式
3) 利用回归方程,推测出该生学期末测验分
解:1)回归系数B:bxy=r(Sy/Sx)=0.40(7.2/6.0)=0.48
2)计算A:axy=Y-bxyX=52.0-0.48×45.0=30.4
把求出的A、B代入,得到从X预测Y的回归方程式:Y=0.48X+30.4
3)当学期初测验X=60时,根据回归方程式可预测出该学生的学期末测验成绩:
把X=60代入得:Y=0.48×60+30.4=59.2
3、 计算机键盘置于什么样的角度,打字时最舒适,询问了75名微机操作人员,结果如下:
角度 0 15 30度
喜爱人数 25 40 10
问人们的感觉是否存在显著性差异
1) 计算出喜爱人数的假设平均数F
2) 计算出X2值
3) 查表检验,并根据P值回答问题
附X2值表
DF P.05 P.01
2 5.99 9.23
解:虚无假设:F1=F2=F3=F
1)F=(f1+f2+f3)/3=(25+40+10)/3=25
2)X2=∑(f-F)2/F=[(25-25)2+(40-25)2+(10-25)2]/25=18
3)查X2值表,df=2时,X2=9.23 ρ=0.01,而求得的X2=18比X2=9.21大。所以可以推翻虚无假设。认为至少在两个角度下喜欢的人数在.01水平上有显著差别
五、 综合应用
1、 随机抽选男女被试各36人进行敲击实验,结果(次/分钟)如下:
平均值 S
男 32.0 5.2
女 38.2 6.0
问:男女被试的敲击速度有无显著差异?
1) 分别计算男女组的SX值
2) 计算SXD值
3) 计算Z值
4) 根据P值回答问题
解:(1)、首先提出虚无假设与备择假设: HO:μ1=μ2 HA:μ1≠μ2
(1)、男被试敲击速度的标准误为:SX1= S1/√n=5.2/√36=0.87
女被试敲击速度的标准误为:SX2= S2/√n=6.0√36=1.0
(2)、样本平均数差异的标准误为:SXD=√SX12+ SX22=√(0.87)2+(1.0)2=1.3
(3)、Z=(X1-X2)/ SXD=(32.0-38.2)/1.3=-4.77
查表检验,被试间大样本,应该查正态分布表。又因为是双侧检验,所以Z分布双侧检验的临界值为:Z.05/2=1.96 Z.01/2=2.56
Z-4.77<Z.01/2-2.56 或Z 4.77>Z.01/2 2.56 P<.01
(4)、结论:男女被试敲击速度的差异是显著的,显著水平的.01。其中男快于女.
2003年心理统计试卷
一、选择
1、中数在一个分布中的百分等级是( A )
A、50 B、75 C、25 D、50-51
2、平均数是一组数据的( D )
A、平均差 B、平均误 C、平均次数 D、平均值
3、两个N=20的不相关样本的平均数差D=2.55,其自由度为( B )
A、39 B、38 C、18 D、19
4、在大样本平均数差异的显著性检验中,当Z≥2.58时,说明( D )
A、P〈.05 B、P〈.01 C、P〉.01 D、P≤.01
5、在一个二择一实验中,被试挑12次,结果他挑对10次,那么在Z=(X-MB)/SB这个公式中X应为( C )
A、12 B、10 C、9.5 D、10.5
6、当XY间相关程度很小时,从X推测Y的可靠性就( A )
A、很小 B、很大 C、中等 D、大
7、在处理两类刺激实验结果时,在下列哪种情况下不可以用正态分布来表示二项分布的近似值?(A )
A、N〈10 B、N≥10 C、N〉30 D N〉10
8、在心理实验中,有时安排两组被试分别在不同的条件下做实验,获得的两组数据是(B)
A、相关的 B、不相关的 C、不一定 D、一半相关,一半不相关
9、运用非参数分析时,要求处理的数据是( D )
A、十分精确的 B、注明单位的 C、大量的 D、等级形式的
10、在X2检验时,遇到下面哪种情况时不宜再用X2检验?( B )
A、F〉10 B、F〈5 C、F〉5 D、F〈10
二、填空
1、统计是一种( 方法 ),它要在(实验设计)正确的前提下才能充分发挥作用
2、用曲线图比较两组的实验结果时,如果两组被试的人数不同,就(不能用绝对的次数比较)用(次数百分数)数进行比较
3、在集中趋势的指标中(中数、众数)不受极端数值的(影响)
4、当平均数大于中数或(众数)时,曲线向(右)偏斜
5、当一种变量增加时,另一种变量也随着(增加),说明这两者间有着(正相关)关系
6、没有因果关系的事物之间,(相关)系数(不一定)等于零
7、正态分布因其M和(σ)不同而各异,M值大,曲线的集中趋势在横轴上越偏( 右 )
8、无论总体分布是否正态,从中抽取许多大样本,其平均数的分布都趋于(正态)分布
9、统计检验结果的显著与否是(相对)的,它的科学性表现在说明了(推论正确)可能有多大
10、显著检验要解决的问题是两个(总体)平均数据的差异是否显著地大于(抽样)误差
三、名词
1、 X2检验:称为卡方,它是实际观察次数与假设次数偏离程度的指标。
2、 双侧检验:它的特点是总体谁强谁弱没有方向性,它的否定区在分布的两端,如.05检验水平,在分布
的两端各有.025的否定区,大样本查正态分布表临界值为.05水平1.96;.01水平2.58。小样本根据df查t表
3、 回归方程式:从一变量的数值预测另一变量的相应数值的直线方程式,当两个变量部分相关时,有两
个回归方程式。
4、 df:能够独立变化的数据的数目。
四、简单应用
1、 小学五年级和初中二年极学生对声音的反应时ms如下:
被试: 1 2 3 4 5 6 S
小学生:300 331 265 287 390 402 51.24
中学生:279 236 287 242 304 276 24.10
问:
1) 两组的平均数和CV各是多少?
2) 从什么数值看出哪组学生的反应较快?
3) 从什么数值看出哪组的平均数代表性较大?
解:1)小学五年级的平均数为:X1=∑x/n=1975/6=329
小学五年级的离中系数:CV1=(S1/X1)×100=(51.24/329)×100=16
初中二年级的平均数为:X2=∑x/n=1624/6=270
初中二年级的离中系数:CV2=(S2/X2)×100=(24.10/270)×100=9
2)从平均数可看出初中二年级的学生反应较性.因为初中二年级学生的平均数270小于小学五年级学生的平均数329.
3) 初中二年级的平均数的代表性比较大,因为它的离散程度CV为9小于小学五年级的CV16。
2、10个被试的视觉和听觉反应时测定结果如下:(与九五年的简单应用题第二题完全相同)
被试号:1 2 3 4 5 6 7 8 9 10
视觉: 179 180 180 190 193 198 200 203 240 250
听觉: 150 135 130 140 140 150 140 147 150 280
1) 分别将两种反应时转换为等级数据
2) 两种反应时的等级相关系数等于什么?
3) 这两种反应时的相关性质和相关程度如何?综合本题具体条件说明相关系数的含义
解:(1)、被试号 一 二 三 四 五 六 七 八 九 十
视觉RT(ms) 179 180 180 190 193 198 200 203 240 250
听觉RT(ms) 150 135 130 140 140 150 140 148 150 280
R1 10 8.5 8.5 7 6 5 4 3 2 1
R2 3 9 10 7 7 3 7 5 3 1
D 7 -0.5 -1.5 0 -1 2 -3 -2 -1 0
D2 49 0.25 2.25 0 1 4 9 4 1 0
得ΣD2=70.5
(2)、rρ=1-[6ΣD2/(n3-n)]
=1-[6×70.5/(103-10)]
=0.57
(3)这两种反应时的相关性质为正相关,相关程度为0.57。说明了视觉与听觉的反应时具有中等强度的相关。
2、 为了解生病对选择反应时(S)的影响,某医生随机选了二组被试各5人,结果如下:
健康者:1,2,2,3,3
患者: 3,3,4,5,5
1) 分别计算二组的平均反应时
2) 完成下元旦A2S5方差分析表
变异来源df SS MS F P
A 1 8.1 8.1 /
S(A ) 6.8 / /
3) 根据上表P值确定二组反应时的差异是否显著说明疾病与选择反应时的关系(与九六年第四道简单应用题第二题完全相同)
附F值表
P 组内df 组间df1 组间df2
.05 4 7.71 6.94
.01 4 21.20 18.00
解:(1)、健康者的平均反应时:X1=∑x/n=11/5=2.2 方差S21=∑(x1-X1)2/n=0.56
患者的平均反应时:X1=∑x/n=20/5=4 方差S22=∑(x2-X2)2/n=0.79
(2)、 ①最大F检验:虚无假设:HO:σ21=σ22
计算最大F值:Fmax=S2max/S2min=0.79/0.56=1.34
检验:k=2,n-1=4。查最大Fmax检验表,得.05水平的临界值为9.60
Fmax1.34< Fmax.059.60 接受虚无假设,即:总体方差一致,适合进行方差分析。
②虚无假设和备择假设 HO:μ1=μ2;HA:两总体间存在差异。
③计算方差的准备数据:
计算数据总和:∑X=X1+X2+X3+……XN=31
计算数据平方和:∑X2= X21+ X22+ X23+……X2N=111
数据总个数N=10 小组数据个数n=5
④计算和方SS:
先计算I值:I=(∑X)2/N=96.1
然后计算总和方:SST=∑X2- I=111-96.1=14.9
计算组间和方:SSA=∑[(∑Xk)2/n]-I=(121+400)/5-96=8.1
计算组内和方:SSE=SST-SSA=14.9-8.1=6.8
⑤计算和方的自由度:
计算组间和方的自由度:dfA=A-1=2-1=1
计算组内和方的自由度:dfE=k(n-1)=2(5-1)=8
计算总自由度:dfT=N-1=10-1=9
⑥计算均方:
计算组间均方:MSA=SSA/dfA=8/1=8.1
计算组内均方:MSE=SSE/dfE=6.8/8=0.85
⑦计算F值:F=MSA/MSE=8.1/0.85=9.5
⑧方差分析表:
变异来源 df SS MS F P
A 1 8.1 8.1 9.5 <.05
S(A) 8 6.8 0.85
⑨F检验:组间df1=1,df2=8。查到F值F.05(1,8)5.32;F值F.01(1,8)11.26,得到的F值9.5大于.05的临界值5.32。因此在是一个在.05水平上显著的F值。
结论:因为P<.05,所以两组反应时在.05的水平上差异显著。患者的选择反应时比健康者要
说明了疾病使得反应时增长了。
五、综合应用(与九五年最后一道题完相同.)
1、 某教员为了比较两种语文教学法,在小学四年级中随机选出两组被试,每组10人,两组的成绩(分)如下:
平均分 S
第一组 甲法 8.9 2.8
第二组 乙法 10.2 2.1
1) 分别计算各组的SX值
2) 计算SXD值
3) 算出Z值
4) 说明两种方法的成绩差异是否显著显著水平如何?
解:首先提出虚无假设与备择假设: HO:μ1=μ2 HA:μ1≠μ2
(1)、第一组的样本平均数的标准误为:SX1= S1/√n=2.8/√49=0.4
第二组的样本平均数的标准误为:SX2= S2/√n=2.1√49=0.3
(2)、样本平均数差异的标准误为:SXD=√SX12+ SX22=√(0.4)2+(0.3)2=0.5
(3)、Z=(X1-X2)/ SXD=(8.9-10.2)/0.5=-2.6
查表检验,被试间大样本,应该查正态分布表。又因为是双侧检验,所以Z分布双侧检验的临界值为:Z.05/2=1.96 Z.01/2=2.56
Z-2.6<Z.01/2-2.56 或Z 2.6>Z.01/2 2.56 P<.01
(4)、结论:两种方法的成绩差异是显著的,显著水平的.01。