楼主: wpwpoiu
1262 14

[问答] 关于XGBoost的问题 [推广有奖]

  • 1关注
  • 0粉丝

初中生

71%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
127 点
帖子
14
精华
0
在线时间
13 小时
注册时间
2018-4-18
最后登录
2018-5-20

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
这是我的代码


w<-read.csv("e:/RF/huizong111.csv",header = T)

ind<-sample(2,nrow(w),replace = TRUE,prob = c(0.75,0.25))
traindata<-w[ind==1,]
testdata<-w[ind==2,]
train<-as.matrix(traindata)
test<-as.matrix(testdata[,-1])
y<-as.matrix(traindata$fl)
library(xgboost)
xgb <- xgboost(data = train, label = y, eta = 0.1,max_depth = 15, nround=25, subsample = 0.5,colsample_bytree = 0.5,seed = 1,eval_metric = "merror",objective = "multi:softprob",num_class = 12,nthread = 3)


[1]        train-merror:0.000000
[2]        train-merror:0.000000
[3]        train-merror:0.000000
[4]        train-merror:0.000000
[5]        train-merror:0.000000
.....
不知道为啥结果都是一样的
数据在https://bbs.pinggu.org/thread-6335135-1-1.html


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
jameschin007 发表于 2018-4-18 15:45:57 |只看作者 |坛友微信交流群
train 数据不能含标签列。

使用道具

藤椅
wpwpoiu 发表于 2018-4-18 15:47:42 来自手机 |只看作者 |坛友微信交流群
jameschin007 发表于 2018-4-18 15:45
train 数据不能含标签列。
那标签列应该放在哪呀

使用道具

板凳
wpwpoiu 发表于 2018-4-18 16:10:10 来自手机 |只看作者 |坛友微信交流群
jameschin007 发表于 2018-4-18 15:45
train 数据不能含标签列。
标签是不用分训练和测试的吗?

使用道具

报纸
wpwpoiu 发表于 2018-4-18 17:31:43 |只看作者 |坛友微信交流群
jameschin007 发表于 2018-4-18 15:45
train 数据不能含标签列。
我把数据分成两部分了  把标签列也单独存放  标签列也分了训练和测试,但是结果还是一样  都是0
train<-read.csv("e:/RF/traindata.csv",header = T)
test<-read.csv("e:/RF/testdata.csv",header = T)
y1<-read.csv("e:/RF/y.csv",header = T)
train<-as.matrix(train)
test<-as.matrix(test)
y<-as.matrix(y1$fl)
xgb <- xgboost(data = train, label = y, eta = 0.1,max_depth = 15, nround=25, subsample = 0.5,colsample_bytree = 0.5,seed = 1,eval_metric = "merror",objective = "multi:softprob",num_class = 12,nthread = 3)
[1]        train-merror:0.000000
[2]        train-merror:0.000000
[3]        train-merror:0.000000
[4]        train-merror:0.000000
[5]        train-merror:0.000000
[6]        train-merror:0.000000
[7]        train-merror:0.000000
[8]        train-merror:0.000000
[9]        train-merror:0.000000
[10]        train-merror:0.000000
[11]        train-merror:0.000000
[12]        train-merror:0.000000
[13]        train-merror:0.000000
[14]        train-merror:0.000000
[15]        train-merror:0.000000
[16]        train-merror:0.000000
[17]        train-merror:0.000000
[18]        train-merror:0.000000
[19]        train-merror:0.000000
[20]        train-merror:0.000000
[21]        train-merror:0.000000
[22]        train-merror:0.000000
[23]        train-merror:0.000000
[24]        train-merror:0.000000
[25]        train-merror:0.000000

使用道具

地板
wpwpoiu 发表于 2018-4-19 11:35:49 来自手机 |只看作者 |坛友微信交流群
jameschin007 发表于 2018-4-18 15:45
train 数据不能含标签列。
同样的参数多跑几次train-merror就不会都是0了  而且会变化这是怎么回事呀  拜托

使用道具

7
jameschin007 发表于 2018-4-19 16:50:47 |只看作者 |坛友微信交流群
wpwpoiu 发表于 2018-4-18 16:10
标签是不用分训练和测试的吗?
traindata 是已知数据  标签是答案啊。
你把标签直接放到已知数据里。 一分析,发现标签列和答案一样,还预测啥啊。

使用道具

8
jameschin007 发表于 2018-4-19 16:51:19 |只看作者 |坛友微信交流群
wpwpoiu 发表于 2018-4-19 11:35
同样的参数多跑几次train-merror就不会都是0了  而且会变化这是怎么回事呀  拜托
test 数据集预测的如何啊。

使用道具

9
wpwpoiu 发表于 2018-4-19 17:16:44 |只看作者 |坛友微信交流群
jameschin007 发表于 2018-4-19 16:51
test 数据集预测的如何啊。
能不能加我的QQ呀 382263876[cry]

使用道具

10
jameschin007 发表于 2018-4-19 17:32:55 |只看作者 |坛友微信交流群
wpwpoiu 发表于 2018-4-19 17:16
能不能加我的QQ呀 382263876
上班用不了。。。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-3 04:10