楼主: ctylinux
4283 1

[求助]请各位高手帮忙啊!如何求矩阵的pearson相关矩阵? [推广有奖]

  • 0关注
  • 0粉丝

学前班

40%

还不是VIP/贵宾

-

威望
0
论坛币
29 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
70 点
帖子
1
精华
0
在线时间
0 小时
注册时间
2007-5-22
最后登录
2014-5-6

楼主
ctylinux 发表于 2008-2-20 23:41:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

各位高手,请帮下我。我在做毕业设计,涉及到了求矩阵(1025*25)的相关矩阵,矩阵要求是pearson Correlation Matrix。求帮忙下,在SPSS下都可以。我主要用这个矩阵到LISREL去求解SEM。谢谢了。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:pearson 相关矩阵 RSO ear ARS 高手 矩阵 帮忙 pearson

沙发
matlab-007 发表于 2015-1-25 20:05:58
1 方法


  性质1: 设X是一个随机变量,其分布函数为F(x),则Y=F(X)服从在〔0,1〕的均匀分布。


  性质2: 设X1,K,Xn是某个分布的一个简单样本,其分布函数为F(x),由性质1可知,在概率意义下,F(X1),F(X2),K,F(Xn)在(0,1)上呈均匀分布,按从小到大依次排序,记为F(X1),F(X2),K,F(Xn),其相应理论值应为ri=i-0,5[]n,i=1,2,…,n,对应分布函数的反函数值F-1(r1),F-1(r2),K,F-1(rn)(在卡方分布中即为卡方分数)应非常接近X1,X2K,Xn,故在概率意义下,这些散点(X1,F-1(r1)),(X2,F-1(r2)),L,(Xn,F-1(rn))应在一条直线上。


  根据性质2,如果X服从正态分布,则散点理论上应落在一直线上,可以用Pearson系数刻画这种分布。但由于随机变异的存在,Pearson系数并不等于1,所以通过随机模拟的方法,制定出Pearson系数的95%界值下限。


  性质3: 由条件概率公式P(X,Y)=P(Y|X)P(X)可知:(X,Y)服从二元正态分布的充分必要条件是固定X,Y服从正态分布(条件概率分布)并且X的边际分布为正态分布。由线性回归的性质ε=Y-(α+βX)可知,固定X,Y的条件概率分布为正态分布的充分必要条件是线性回归的残差ε服从正态分布,由此可得:(X,Y)服从二元正态分布的充分必要条件是X的边际分布为正态分布以及线性回归模型Y=α+βX+ε中的残差服从正态分布。
设X来自于正态总体,从正态总体中随机模拟抽样5000次,每次抽样样本含量分别为7至50,对F(x)求秩,求出排序后的F(x)和排序后的X的Pearson相关系数。表1 随机模拟5000次得到的检验正态分布的Pearson相关系数的界值(略)


  类似地,我们也可以用同样的方法得到检验卡方分布的Pearson相关系数的界值表(简化表)表2 相关系数界值表(略)
                 


  2 随机模拟验证


  21  Pearson相关系数界值表的随机模拟验证


  设X来自于正态总体,从正态总体中随机模拟抽样5000次,每次抽样样本含量分别为10,20,30,40,50,并计算相应的Pearson卡方系数,以及落在界值外面的比例,即拒绝比例,再在同一批数据的前提下用McNemar检验比较本方法和Swilk法的差别。表3 (一元正态分布)模拟次数(略)表4(一元偏态分布,χ2)模拟次数(略)            


  以上方法拒绝比例在样本量为7的可信区间为[78.37%,94.12%],在其余样本量时都接近100%,可以证实是正确的。


  22  卡方分布界值表的随机模拟验证 


  表5 卡方分布:模拟5000次(略)


  
  23 马氏距离的随机模拟验证


  根据马氏距离的定义,从正态分布总体中随机抽取样本量分别为10,20,30,40,50的样本模拟5000次,根据上面提到的方法以卡方分数对X1,X2K,Xn求Pearson系数,并根据以上的相关系数界值表,计算相应的统计量,即拒绝比例。表6 马氏距离落在Pearson系数界值表外的比例(略)


  24 二元正态分布资料的随机模拟验证


  设定一个二维矩阵A,分别求出特征值P和特征向量Z,设X的元素均来自于正态总体分布,则Y=Z′×X必服从二元正态分布,随机模拟5000次,根据性质三介绍的方法验证的拒绝比例如下。表7  (二元正态分布)模拟次数(略)表8  (二元偏态分布,χ2)模拟次数(略)                 


  25 三元正态分布资料的随机模拟验证


  类似地,随机模拟5000次,用同样方法进行验证,得到对于三元正态分布数据的拒绝比例。表9 (三元正态分布)模拟次数:5000次

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-24 21:02