楼主: werewrwer234231
1491 2

[问答] xboosting 问题求教 [推广有奖]

  • 3关注
  • 0粉丝

本科生

83%

还不是VIP/贵宾

-

威望
0
论坛币
6 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
965 点
帖子
46
精华
0
在线时间
102 小时
注册时间
2016-7-11
最后登录
2019-8-13

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请问如何把数据加工成xboosting所要求的类型  
train_csv1 <- select(train_csv,-Date)
s <- sparse.model.matrix(Sales~.-1, data = train_csv1)
labels = train_csv1['Open']
bst <- xgboost(data = s, label =labels, max.depth = 4,eta = 1, nthread = 2, nround = 10,objective = "binary:logistic")
http://pan.baidu.com/s/1c2w2TFi   数据
求个大神帮忙看一下 他说我数据长度不一样。
之前查相关资料说label 只能是0到1的数字   
求教如何正确的预测Sales的数字
http://pan.baidu.com/s/1pLNkPOv 这个是测试数据集
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Boosting boost 问题求教 ING STI

沙发
飞天玄舞6 发表于 2017-4-27 15:03:07 |只看作者 |坛友微信交流群
你的test数据少一列Customers,没法预测。
训练的代码:
  1. library(data.table)
  2. library(xgboost)
  3. train <- fread("train.csv")
  4. train <- data.frame(train)
  5. train$Date <- NULL
  6. train <- apply(train,2, as.numeric)
  7. label <- train[,3]
  8. train <- as.matrix(train[,-3])
  9. xgb_train_matrix <- xgb.DMatrix(data = train, label = label)
  10. sgb_fit <- xgb.train(data = xgb_train_matrix,nrounds=50,booster='gblinear',eta=0.2,subsample = 0.6,
  11.                      objective = 'reg:linear',nthread=4,eval_metric = 'rmse')
  12. pred <- predict(sgb_fit,train)
  13. cor(label,pred)
复制代码

相关系数0.92,还不错。
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
werewrwer234231 + 1 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 1  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

藤椅
werewrwer234231 发表于 2017-4-27 17:38:26 |只看作者 |坛友微信交流群
飞天玄舞6 发表于 2017-4-27 15:03
你的test数据少一列Customers,没法预测。
训练的代码:
感谢大神!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 14:15