|
1. pearson相关系数是两个连续变量间用的,连续变量和分类变量间应该检验不同类别间的均值差异(T检验之类的),分类变量间做卡方检验;所以你的问题是没有意义的。
2. 假设Y、X是两个连续变量,sd(y)、sd(x)是两者的标准差, 回归方程是y=a+bx,
那么有:回归系数b=相关系数p*(sd(y)/sd(x)),这是两者最直白的数学关系。所以回归系数与相关系数是两个不同的东西;只有当两个变量的标准差相等时,相关系数才等于回归系数;回归方程的标准化系数与相关系数相同。举例如下:
sysuse auto
sum price mpg
correlate price mpg
reg price mpg
reg price mpg, beta // beta显示标准化回归系数
di -0.4686* 2949.496/ 5.785503
3. 相关系数和线性回归系数虽然都是说相关性,但解释是不一样的:回归系数可以说1单位的X变动导致b单位的Y变动;相关系数是说1个标准差的X变动p单位的Y变动。
4. 所以直接比较是相关系数和线性回归系数的大小是没有意义的,一般来说,相关系数绝对值越接近1,回归系数的显著性水平会越高。
5. 有问题尽量先 google 和 百度
|