卡方女神是T小弟和F大叔的近亲,何处此言?我们来回忆一下他们俩的定义——
T小弟:假设X服从标准正态分布N(0,1),Y服从χ2(n)分布(卡方分布),那么Z=X/sqrt(Y/n)的分布称为自由度为n的t分布,记为 Z~t(n)
F大叔:设X、Y为两个独立的随机变量,X服从自由度为d1的卡方分布,Y服从自由度为d2的卡方分布,这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布。
偶吼吼,女神不属于屌丝,女神应该被大叔和正太扑倒好么?(楼主你在想啥呢?能严肃点么?{:3_49:},另外近亲是不能**的,真为楼主的智商捉急)
……
好吧,咱严肃点。
其实说χ2分布与其他两者的关系近,一点都没错,但它其实是伽马分布的一个特例(想知道什么是伽马分布么?你可以度娘谷哥,也可以戳这个链接:http://zh.wikipedia.org/wiki/伽玛分布),更与大名鼎鼎的正态分布有着千丝万缕的关系。
定义: 设 X1,X2,......Xn相互独立, 都服从标准正态分布N(0,1), 则称χ2=X12+X22+......+Xn2所服从的分布为自由度为 n 的χ2 分布。(卡方分布是由正态分布构造而成的一个新的分布,当自由度n很大时, χ2分布近似为正态分布。)
χ2有个很好的性质,就是她的期望=自由度;方差=2倍自由度。
具体说来:
1)
2)
3)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。
4) 若
有一个问题:为什么从正态总体中抽取出的样本的方差服从χ2 分布 ?
在抽样分布理论中,从正态总体进行一次抽样就相当于独立同分布的 n 个正态随机变量ξ1,ξ2,…,ξn的一次取值,将 n 个随机变量针对总体均值与方差进行标准化得(i=1,…,n),显然每个都是服从标准正态分布的,因此按照χ2 分布的定义,应该服从参数为 n 的χ2 分布。
如果将中的总体均值 μ 用样本平均数 ξ 代替,即得,它是否也服从χ2分布呢?理论上可以证明,它是服从χ2 分布的,但是参数不是 n 而是 n-1 了,究其原因在于它是 n-1 个独立同分布于标准正态分布的随机变量的平方和。
我们常常把一个式子中独立变量的个数称为这个式子的“自由度”,确定一个式子自由度的方法是:若式子包含有 n 个独立的随机变量,和由它们所构成的 k 个样本统计量,则这个表达式的自由度为 n-k。比如中包含ξ1,ξ2,…,ξn这 n 个独立的随机变量,同时还有它们的平均数 ξ 这一统计量,因此自由度为 n-1。
又有一个问题:从分布的定义中可以看出,χ2分布是T分布和F分布的形成条件之一,除此以外她又有何实际意义?
通过χ2分布可以构造χ2统计量来进行χ2检验。卡方检验用于检验抽样的样本是否符合指定的概率分布,它的思想是计算样本的频率分布和指定分布之间的差,并构造一个卡方统计量来检验。这也许就是其最主要的贡献了!
帮助人大经济论坛推广,复制贴子内容(带人大经济论坛网址)并发到其他论坛和网站;或点击贴子标题后的“推广有奖”,把本贴推荐到QQ群或自己的微博(最好@人大经济论坛),然后跟贴贴出链接或截图,证明已作推广的,将获得如下论坛币的奖励!(大家一定要把群现有人数或微博粉丝人数截屏出来哦~不然只能奖励10个币哦)
活动奖励方式(同一个群或微博或网站分享多次算一次,所有截图均需显示分享人数,否则默认低档奖励):
1.凡分享的QQ群,人数在100人以下的,视情况奖励10-20论坛币;100-500人的,奖励20-50论坛币(每群限奖励一次);500人以上的奖励50-100论坛币。
2.凡分享到微博,您的粉丝在100人以下的,视情况奖励10-20论坛币;100-500人的,奖励20-50论坛币(每微博限奖励一次);500人以上的奖励50-100论坛币。
3.凡分享到其他网站(包括校内网等),帖子保留一天以上的(24小时后截图),奖励50论坛币

38 个论坛币

雷达卡





京公网安备 11010802022788号







