楼主: 小吭
35085 12

correlation 与 covariance区别 [推广有奖]

  • 6关注
  • 1粉丝

已卖:15份资源

讲师

36%

还不是VIP/贵宾

-

威望
0
论坛币
1100 个
通用积分
8.9343
学术水平
26 点
热心指数
64 点
信用等级
31 点
经验
8011 点
帖子
321
精华
0
在线时间
514 小时
注册时间
2013-4-16
最后登录
2023-10-2

楼主
小吭 发表于 2015-6-20 12:13:54 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如题所示,两者都可以便是变量间的相关性。
但是他俩应用上的区别是什么?在解答变量间相关关系时,应该用哪个?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:correlation covariance relation variance varian 相关性

回帖推荐

foozhencheng 发表于5楼  查看完整内容

呃。。。我不是金融方向的,只是最近比较感兴趣,于是来到这儿。所以一时半会儿想不到可以用什么金融的例子来解释。不过,可以从高中数学的向量部分做一下类比。比如,一组数据我们可以将其看成一个向量,每一个分量就是每一个数。高中课本上应该引入了点乘/内积/点积的概念(不知道各地教材是不是都讲了。。。),同时还给了一个公式,即两个向量的夹角的余弦值等于两个向量的点积除以两个向量的模/长度之积。类比过来,covaria ...

statax 发表于4楼  查看完整内容

二楼已经说对了。根据定义,相关系数就是标准化后的协方差。看看公式就可以了,标准化就是每个样本都减去均值后除以标准差。

本帖被以下文库推荐

沙发
foozhencheng 学生认证  发表于 2015-6-20 14:04:46 来自手机
correlation感觉是把covariance做了归一化,而且一般是不同时刻的变量,反应时间关联特性。covariance就是算个协方差~
PS:新手,可能理解得不对。大神轻喷~
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
胡老 + 5 + 5 + 5 精彩帖子
statax + 10 + 1 + 1 精彩帖子

总评分: 论坛币 + 10  学术水平 + 6  热心指数 + 6  信用等级 + 5   查看全部评分

藤椅
小吭 发表于 2015-6-20 14:45:09
foozhencheng 发表于 2015-6-20 14:04
correlation感觉是把covariance做了归一化,而且一般是不同时刻的变量,反应时间关联特性。covariance就是算 ...
没能理解大神的意思。。。。感谢大神给予帮助,可否再详细说明一下?

板凳
statax 发表于 2015-6-20 19:47:51
二楼已经说对了。根据定义,相关系数就是标准化后的协方差。看看公式就可以了,标准化就是每个样本都减去均值后除以标准差。
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
胡老 + 5 + 5 + 5 精彩帖子
crystal8832 + 10 + 1 热心帮助其他会员

总评分: 论坛币 + 10  学术水平 + 5  热心指数 + 6  信用等级 + 5   查看全部评分

报纸
foozhencheng 学生认证  发表于 2015-6-21 00:33:15
小吭 发表于 2015-6-20 14:45
没能理解大神的意思。。。。感谢大神给予帮助,可否再详细说明一下?
呃。。。我不是金融方向的,只是最近比较感兴趣,于是来到这儿。所以一时半会儿想不到可以用什么金融的例子来解释。不过,可以从高中数学的向量部分做一下类比。比如,一组数据我们可以将其看成一个向量,每一个分量就是每一个数。高中课本上应该引入了点乘/内积/点积的概念(不知道各地教材是不是都讲了。。。),同时还给了一个公式,即两个向量的夹角的余弦值等于两个向量的点积除以两个向量的模/长度之积。类比过来,covariance相当于点积,而correlation相当于这里的“两个向量的夹角的余弦值”。为什么这么说?看一下covariance和correlation的定义不难发现,这里的向量其实是把数据的每个点都减去该组数据的平均值。为什么要减去平均值呢?个人理解是:减去平均值后,每个数据点的大小就没有绝对意义了,而表征的是偏离平均值的程度,因此更有统计上的意义。这样处理后的数据/向量我们可以视为“反映数据偏离平均值程度“的向量,这样我们考察这个向量的长度(其实是长度的平方),它反映了数据总体偏离平均值程度也就不奇怪了,这个就是SST(Total Sum of Squares),为了看每个数据/自由度的偏离情况,我们除以数据的个数(也就是向量的维数)/自由度的数目,进而得到方差也就好理解了。
        扯了这么多,回过头来看correlation和covariance。covariance就是两组数据“反映数据偏离平均值程度“的向量的点积,因此covariance包含了两组数据的互相关联的信息。但是事情没完,点积是正比于两个向量的长度的乘积的,换句话说点积大不一定表示两个向量的“关联”大,而有可能是两个向量本身很长!所以一定要把两个向量的长度的乘积除掉才能真正得到两个向量夹角的余弦值,也就得到了两组数据的correlation的大小,而把数据的绝对发散度的影响扣除掉了。好吧,说了这么多,布吉岛类比点积+夹角余弦与covariance+correlation对lz你有木有帮助。如果要进一步解释考虑一组随时间变化的数据不同时间点的correlation,也就是传说中的autocorrelation function(ACF)的话,只需要把不同时刻的数据看成两组数据即可。但是如果你要问窝为什么要引入ACF或者诸如correlation之类的概念的话,窝恐怕只能给你讲光学了,什么干涉啊之类的(原谅窝一个物理狗。。。实在是经济、金融知识匮乏。。。),所以建议lz还是反复体会一下从向量/线性代数/几何这方面切入去思考吧~
已有 3 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
胡老 + 5 + 5 + 5 精彩帖子
我的素质低 + 5 精彩帖子
小吭 + 5 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 10  学术水平 + 6  热心指数 + 6  信用等级 + 6   查看全部评分

地板
小吭 发表于 2015-6-21 18:37:53
foozhencheng 发表于 2015-6-21 00:33
呃。。。我不是金融方向的,只是最近比较感兴趣,于是来到这儿。所以一时半会儿想不到可以用什么金融的例 ...
太感谢你了。。。虽然我数学基础薄弱。。。。

7
foozhencheng 学生认证  发表于 2015-6-22 13:20:32
小吭 发表于 2015-6-21 18:37
太感谢你了。。。虽然我数学基础薄弱。。。。
没事啦~一起学习,共同进步!

8
kevinchenc 发表于 2015-7-10 17:16:34
Corr其实把variance信息都除去了--- 可以看到Corr的对角元素都是1了

所以在实际分析中,
如果数据集中的数据 都为同一单位,取cov做PCA,这样不会丢失variance信息
如果数据的单位不同,而且差别很大,取corr然后PCA

结果肯定是不一样的。


已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
胡老 + 5 + 5 + 5 精彩帖子
小吭 + 2 + 1 + 1 精彩帖子

总评分: 论坛币 + 2  学术水平 + 6  热心指数 + 6  信用等级 + 5   查看全部评分

9
望舒悦 发表于 2015-7-12 12:37:15
foozhencheng 发表于 2015-6-21 00:33
呃。。。我不是金融方向的,只是最近比较感兴趣,于是来到这儿。所以一时半会儿想不到可以用什么金融的例 ...
写了好多,好长啊,我看懂了,十分感谢~

10
foozhencheng 学生认证  发表于 2015-7-12 15:29:08
望舒悦 发表于 2015-7-12 12:37
写了好多,好长啊,我看懂了,十分感谢~
能有收获就好啦~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-25 16:47