从一开头学统计学到现在好几年了,我发现不论是我国现行的教材、期刊都存在大量的统计学错误,呈在cos论坛上探讨过。
我在温习秩和比分析并参照另外两个例题作sas编程的时候发现这两个例题都有不同程度的错误。
例1 来自于《医学综合评价方法及其应用》化学工业出版社2006年2月第一版P44例题4-6,作者在排序分档的表4-14中把观测7错分到第4档,致结果异常。
本人的编程如下:
data w;
input no x1-x5;
cards;
1.00 6.00 .03 .04 54.00 108.00
2.00 7.00 .10 .06 42.00 165.00
3.00 5.00 .26 .48 110.00 180.00
4.00 8.00 .09 .32 85.00 231.00
5.00 4.00 .05 .70 78.00 144.00
6.00 10.00 .19 .62 97.00 240.00
7.00 7.00 .01 .41 39.00 130.00
8.00 8.00 .15 .55 65.00 144.00
;
proc rank descending out=a;var x1-x5 ;ranks r1-r5;/*递降排秩的变量*/
data a1;set a;rs=mean(of r1-r5)/8;/*观测的个数10*/
proc sort data=a1 out=a2; by rs;
proc rank data=a2 out=a3;var rs;ranks rr;
data a4;set a3;sr=lag7(1-1/4/8);/*校正*/rrr=rr/8;if sr=. then r=rrr; if sr^= . then r=sr;
if dif(r)=0 then delete;p=probit(r)+5;if p<= 3.5 then g=1;if p >3.5 & p<=5 then g=2;if p>5 & p<=6.5
then g=3; if p>6.5 then g=4;/*分档情况*/drop rr sr rrr;
proc print data=a4;
proc reg;
model rs=p;
proc glm;
class g;
model rs=g/ss3;
means g/snk;
run;
例2 来自于《中国医院统计》2006年6月13卷2期,在P118的表1诊断符合率、危重病人抢救成功率两列的手工排序上出现严重混乱,致使其一切结果不可信。
编程:略