楼主: haichao1990
16355 13

[问答] 'newdata'必需有237行 但变量里有473行 [推广有奖]

11
jiangbeilu 学生认证  发表于 2016-8-12 10:48:27
haichao1990 发表于 2016-8-12 10:38
但觉得还是不对呀,我是想用占2/3的训练集得出模型OSLfit1后,再用这个模型OSLfit1去对占比1/3的测试集进 ...
因为我没有你的train data 数据,所以你需要自己替换一下。
就算是对test data,也有真实值和预测值的,你的统计基础需要加强了。

12
haichao1990 发表于 2016-8-12 11:06:53
jiangbeilu 发表于 2016-8-12 10:48
因为我没有你的train data 数据,所以你需要自己替换一下。
就算是对test data,也有真实值和预测值的, ...
我用的数据集由710,然后随机分配2/3作为训练集,1/3作为测试集

train=read.csv("train_data473.csv") #473条  # (训练集)
OSLfit1=lm(Y~.,data=train)  #用训练集得出的模型OSLfit1

然后我想用上面训练集得出的模型OSLfit1来对另外的数据集(即测试集),测试模型的精确度,我是这个意思哦

pre=read.csv("test_data237.csv") #237条   (训练集)
yhat<-predict(OSLfit1,data.frame(pre[,2:18]))
这样对吗?

训练集和测试集  http://pan.baidu.com/s/1bVoHrw

13
jiangbeilu 学生认证  发表于 2016-8-12 14:15:07
haichao1990 发表于 2016-8-12 11:06
我用的数据集由710,然后随机分配2/3作为训练集,1/3作为测试集

train=read.csv("train_data473.csv") ...
对,就是像你现在这样子做的

14
lovely32 发表于 2018-5-21 20:51:36
训练集和测试集的变量名称不相同造成的。统一列变量名称后就行了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-17 11:54