用R语言做二元线性回归分析
从R语言中获得原始的数据集women,里面有身高和体重两个数据,用他们做相关分析。
输入命令获取数据集
data(women)
采用names()命令获取数据集的相关列的名称
names(women)
初步判断数据是否有相关性,使用散点图进行初步判断
plot(women$height,women$weight,col=”blue”)
如果散点图表明有一定的相关性,可以进一步分析,采用lm()命令
a=lm(women$height~women$weight)
采用summary()函数获取详细数据
Summary(a)
输入以下命令使得作图显示出2-2四个图形
par(mfrow=c(2,2))
绘制回归散点图
plot(lm(women$height~omen$weight),col=”red”)
方差分析采用anova()命令
输入anova(a)
Analysis of Variance Table
Response: women$height
Df Sum Sq Mean Sq F value Pr(>F)
women$weight 1 277.483 277.483 1433 1.091e-14 ***
Residuals 13 2.517 0.194
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.
另外,为了大家更好的学习R语言和量化投资,我建了一个交流群,大家感兴趣的可以加一下: 226224941
注:引用数据框dataframe时的格式是a $ b ,中间是一个美元符号,发到论坛上就没了