题目感觉表述的不是理想,看下文吧。
第1天测的数据 10 10 30 40 50 51 52 50 51 50 52 48 49 40 30 20 10
第2天测的数据 11 9 31 40 41 50 51 52 49 52 50 51 49 51 52 53 48 50 51 48 49 51 50 39 30 21 11
第3天测的数据 9 10 30 40 50 51 52 52 50 51 49 51 52 53 53 48 52 51 49 31 19 12
第4天测的数据 10 12 39 52 51 50 49 52 50 51 48 52 50 49 51 52 48 49 38 20 9
第5天测的数据 11 11 30 32 40 42 41 52 51 49 51 52 53 50 49 50 51 48 48 52 50 48 49 38 20 9 10
第6天测的数据 9 10 27 40 50 49 51 52 53 48 50 49 51 52 49 51 52 53 48 30 10
第7天测的数据 8 10 25 30 39 48 50 49 51 49 51 52 52 53 48 50 49 50 49 35 27 8
第8天测的数据 7 12 29 31 41 49 51 52 53 48 50 49 53 50 36 27 18
第9天测的数据 9 12 19 35 52 50 51 48 52 50 48 50 51 48 49 50 49 51 52 34 27 9
共记录9天(行)数据,每天的数据(列)也是依据时间先后顺序记录的,但是每天观测的数据量不同。
9组数据共同点是前3-7个和后2-4个(用黑色表示)数据比较离散。而中间的数据(红色表示)趋于稳定都在50左右。我想界定出每天从前往后和从后往前分别是从第几列数据均值趋于稳定?也就是说从前往后是从第3个还是4,5,6,7列个趋于稳定?从后往前是从倒数第2还是第3,4列数据趋于稳定?用什么办法来比较呢?我有3个想法:
1. 用独立样本t检验。先比较第1,2列均值,如果相等就结束,如果不等继续比较第2,3列均值,直到第k和k+1列均值相等,认为k列以后的数据是稳定的。同理比较倒数第1,2列均值,倒数第2,3列均值。。。(这会存在一个问题就是第1,2列均值如果没有显著差异就马上结束了,没有办法继续判断)
2. 用单因素方差分析。因为每天数据量不同,就是数据的列数不一致,没有办法一列列比较。但是从原始数据看出在第4-8列以后趋于稳定,因此稍微保守一点,比较前10列,通过多重比较确定哪些列之间的均值差异。比如,如果第5列后的均值没有差异认为第5列以后趋于稳定。
3. 将9天所有数据(即整体)的均值记为A(N),去除第一列数据后数据均值A(N-1),如果二者差异不显著则结束,如果差异显著继续比较A(N-1)和A(N-2),如果差异不显著结束,如果差异显著继续比较。。。直到A(K)和A(K-1)无显著差异。至此界定从前往后第K-1列以后的数据趋于稳定。同理从后往前界定从倒数第几列趋于稳定。这也存在一个问题,就是A(K-1)的数据全部是A(K)中的数据,只是去除了一列而已,那么比较二者的均值是不是就不能用独立样本,而应该用one-samples T Test。其中第K次比较的Test Value(总体的均数)取去除前K列的所有剩余数据的平均值。
我个人倾向与第3种方法。但是我担心如果数据的列数比较多,只是去除其中的一列,均值可能没什么显著变化,导致判断不出来差异。
刚学spss,统计的方法感觉不是很有把握,问题也不知道表述清楚没有。请高手给点意见。谢谢!