[问答] 单样本T检验的样本量影响 [推广有奖]

0关注
0粉丝

本科生

87%

还不是VIP/贵宾

威望: 0 级
论坛币: 1666 个
通用积分: 5.4017
学术水平: 1 点
热心指数: 1 点
信用等级: 1 点
经验: 1025 点
帖子: 70
精华: 0
在线时间: 137 小时
注册时间: 2007-4-15
最后登录: 2022-3-30

楼主

foreseer201 发表于 2011-12-12 17:59:48 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

看到过T检验适合小样本量的说法，尤其是对30以下的样本量。
按照谢老大的一个图示例子，照猫画虎做了个图形验证这个结论。
验证单样本T检验，思路如下：
1、随机生成10000个均值为1的数据；
2、将样本量i从10到1000循环，从10000个总数据中抽取i个数据并进行均值为1的T检验，针对每个i做10次取检验p值的平均数；
3、记录样本量i和对应平均p值的对应编写，并画散点图。
从第一个图看出，样本量对检验的结果并没有很大的影响。
而传入检验的均值参数不是1：以0.9、0.8、0.7、0.6，直到0.6时才有显著的效果。
如第二图所示，但也是在样本量较大的时候，p值都表现在0.05的拒绝线以下。小样本中很多犯了取伪错误。
多运行几次0.6的效果不一（0.05线以下的点数），但总体都是大样本好于小样本。
自己从两图得出的结论是，T检验并不是小样本量的时候效果很好。有两个问题请教大家：
1、不知道这个验证靠谱不，在思路或基本概念上有没有很大的问题。
2、程序中用到了个for循环，因为循环体内的部分用到了计数i，用不了replicate。这种显式循环能有别的办法替代么。
谢谢 ~~
代码如下