3544 19

求计数数据的P值 [推广有奖]

11
小宝爱波1314 发表于 2014-8-14 20:02:41
jingju11 发表于 2014-8-14 19:23
很抱歉,一下子想不出一个合适的检测。

京剧
我也想不出来啊。所以才到论坛请教呢

12
jingju11 发表于 2014-8-14 22:33:40
For more people who are interested, i post the data in EXCEL here. Jingju
data have;
N = 3987;
input rate        total;
datalines;
0.10        12
0.15        21
0.20        29
0.25        35
0.30        38
0.35        42
0.40        48
0.45        53
0.50        60
0.55        64
0.60        72
0.65        78
0.70        85
0.75        91
0.80        93
0.85        98
0.90        106
0.91        109
0.92        111
0.93        111
0.94        114
0.95        114
0.96        117
0.97        117
0.98        118
0.99        119
1.00        120
;

13
jingju11 发表于 2014-8-15 04:45:34

这里的问题是相关联的比率(rate=1包含所有的rate<1). 这样如何呢?

Rate/N



Rate=1.0





1


0



Rate=0.1


1


a=12


b=0


a+b=12


0


c=108


d=3858


c+d=3966




a+c=120


b+d=3858


n=3978


如何理解呢?

Rate=0.1认定为不完全处理, rate=1.0为完全处理.但是两者都是在同一个数据之上.现在我们要比较两者的边际概率是否不同? 12/3978 =  120/3978? 那么,NcNemar’s test如何呢? 因为b = 0 (总是), 所以这个检测概率变得很简单:渐进p value = sdf(‘chisq’, c, 1), 精确p = 2 * 2**-c.

其他情况依此类推.

值得注意的是:McNemar的检测只与b c (非匹配对的个数)有关. 在我的拨可里进行了详细的计算.

非常欢迎大家的讨论.

http://blog.sina.com.cn/s/blog_a3a926360102uz7v.html

京剧

14
小宝爱波1314 发表于 2014-8-17 21:11:35
jingju11 发表于 2014-8-15 04:45
这里的问题是相关联的比率(rate=1包含所有的rate
谢谢京剧的精彩回答。如果total的数量非常大的话,应该是什么样的呢?数目很大的话,应该不适合用精确检验吧?

rate        total
0.1        183
0.15        283
0.2        374
0.25        453
0.3        550
0.35        652
0.4        741
0.45        825
0.5        912
0.55        997
0.6        1109
0.65        1196
0.7        1308
0.75        1396
0.8        1480
0.85        1579
0.9        1670
0.91        1682
0.92        1696
0.93        1711
0.94        1734
0.95        1752
0.96        1767
0.97        1781
0.98        1794
0.99        1802
1        1817

15
小宝爱波1314 发表于 2014-8-18 17:01:11
小宝爱波1314 发表于 2014-8-17 21:11
谢谢京剧的精彩回答。如果total的数量非常大的话,应该是什么样的呢?数目很大的话,应该不适合用精确检验 ...
0.1        130
0.15        202
0.2        263
0.25        323
0.3        387
0.35        465
0.4        535
0.45        592
0.5        663
0.55        726
0.6        800
0.65        865
0.7        944
0.75        1016
0.8        1075
0.85        1149
0.9        1225
0.91        1236
0.92        1249
0.93        1260
0.94        1276
0.95        1288
0.96        1301
0.97        1311
0.98        1322
0.99        1329
1        1340
还有这样的数据,好像用上述的方法都不太合适

16
jingju11 发表于 2014-8-19 00:13:25
小宝爱波1314 发表于 2014-8-18 17:01
0.1        130
0.15        202
0.2        263
还有这样的数据,好像用上述的方法都不太合适
本文来自: 人大经济论坛 SAS专版 版,详细出处参考: https://bbs.pinggu.org/forum.php? ... e=2&from^^uid=1032463
I did not get you.
如果不合适,你都懒得把你的理由说出来? 在FREQ里,有些精确检验的确费时.但是对于二联表格,变化是如此之少,精确检验能慢到哪里?
我一直在想在这里mcnemar' s test是否合适?但是,想不出针对这种类型的数据,什么检测更加合理?
京剧

17
小宝爱波1314 发表于 2014-8-19 09:56:56
jingju11 发表于 2014-8-19 00:13
I did not get you.
如果不合适,你都懒得把你的理由说出来? 在FREQ里,有些精确检验的确费时.但是对于 ...
不好意思呀,我的意思是列联表的格子里的数小于5的话用fisher检验可以得到更好的结果,但是对于格子里的数更大的话用Fisher精确检验是不是不合适呢?主要是我的统计学知识很少,只知道一些基本常用的方法,所以前面说的不清楚

18
小宝爱波1314 发表于 2014-9-3 20:25:24
jingju11 发表于 2014-8-14 19:23
很抱歉,一下子想不出一个合适的检测。

京剧
hi,京剧你好。我遇到了一个R*C列表数据的比较,但是翻了我们很多统计的教材没有找到合适的方法,你能帮我看一下么?
我需要比较一下一组人群的年龄段的个数在我处理前和处理后有没有差别,觉得用校正卡方检验并不合适,而且我的处理后有多组数据,都需要拿来和处理前的数据进行比较,在这个问题上翻阅了一些资料也没有找出结果,所以找您求助了。

age_stage        count1        count2
0-10                1511               1485
10-20        856               843
20-30        578               575
30-40        431               448
40-50        369               391
50-60        236               234
60-70        2               2
>70                3               3
missing        1               6
count1 代表的是处理前,count2代表的是处理后

19
jingju11 发表于 2014-9-4 07:47:33
比较一下一组人群的年龄段的个数在我处理前和处理后有没有差别
本文来自: 人大经济论坛 SAS专版 版,详细出处参考: https://bbs.pinggu.org/forum.php?mod=viewthread&tid=3165237&page=2&from^^uid=1032463
没有理解你的要求是什么。京剧

20
小宝爱波1314 发表于 2014-9-4 10:34:59
jingju11 发表于 2014-9-4 07:47
没有理解你的要求是什么。京剧
比较处理前后的频数有无差别呀

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 11:52