请问在计算两组样本的协方差时,两组样本的数量是否必须相同?
举例:
把这两组数据看做是二维随机变量(X,Y),
要求协方差cov(X,Y)
有公式cov(X,Y)=E{[X-E(X)]*[Y-E(Y)]}
=E(X*Y)-E(X)*E(Y)
又因为,求期望的表达式为E(X)=∑Xi*Pi
由于样本中元素较少,每个元素的概率可以看作相等,都为1/n
因此,E(X)=(∑Xi)/n
同理可得,E(Y)=(∑Yi)/n
E(X*Y)=(∑Xi*Yi)/n
最终结果为:
cov(X,Y)=(∑Xi*Yi)/n-(∑Xi)(∑Yi)/n^2
这里两组样本数量都是n,
假如一个样本数量为n,另一个为m时,这样计算出来的协方差还是否有意义?