rm(list=ls())
same = sample(1:500,100)
index1 = sample(501:5000,500)
index2 = sample(501:5000,300)
id1 = c(same,index1)
id2 = c(same,index2)
name1 <- paste("V",id1,sep="_")
name2 <- paste("V",id2,sep="_")
data1 <- data.frame(id1=name1,y=rnorm(600))
data2 <- data.frame(id2=name2,x1=rbeta(400, 1, 2))
上面的代码是生成数据的,你们不需要去修改任何东西。你们根据上面生成的data1和data2,id1和id2表示名字,将两个数据按照名字进行合并。注意,我们不需要修改为一致的名称,比如id,merge命令可以实现这样类型数据合并。
具体要求:
1、将data1和data2进行合并,合并后的新数据为data_new。
2、将data_new中的y和x1建立回归模型,即y=c+beta1*x1+error,并把结果用表格形式输出,需要包括系数、标准误、t值和p值等。当然,有同学乐意用手动去整理表格的,也非常欢迎。
3、写出merge命令中by.x,by.y,all.x,all.y这四个选项表示什么意思。
这道题怎么做,代码怎么写