楼主: yaoqsm321
5191 36

[问答] 请教关于xgboost的优化问题 [推广有奖]

  • 1关注
  • 0粉丝

本科生

28%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
873 点
帖子
81
精华
0
在线时间
70 小时
注册时间
2015-5-28
最后登录
2017-9-7

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
刚学xgboost,通过下面的代码初步建立了模型,也能跑出结果,不过结果是以概率的形式展现的(不知道为什么),结果的正确率大概也只有50%,然后无论我怎么去调参数,结果永远是50%,不会改变,改变的只有概率的大小(没有用),郁闷了,请大家帮忙看下是怎么回事,该怎么去优化。(附上整理后的数据,id为因变量y,其余为变量x)
代码:
svmdata<-read.csv("E://12yue//12quan.csv",header=T)
ind<-sample(2,nrow(svmdata),replace=TRUE,prob=c(0.9,0.1))
traindata<-svmdata[ind==1, ]
testdata<-svmdata[ind==2, ]

tdata <- as.matrix(traindata)
edata <- as.matrix(testdata)
y <- as.matrix(traindata$id)


library(xgboost)

xgb <- xgboost(data=tdata,label=y,max.depth=6,eta=0.3,nrounds=5000,verbose=2,objective="binary:logistic")


pred <- predict(xgb,sdata)


shuju.xlsx (4.98 MB)








二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:boost Data SVM 不知道 正确率 因变量 模型

shuju1.xlsx

4.99 MB

沙发
yaoqsm321 发表于 2017-2-13 09:51:26 |只看作者 |坛友微信交流群
对了,测试数据一定要把id那一列给删掉,要不然出来的结果是全对的

使用道具

藤椅
yaoqsm321 发表于 2017-2-13 10:04:00 |只看作者 |坛友微信交流群
运行结果是这样的

微信截图_20170213100238.png (9.04 KB)

微信截图_20170213100238.png

使用道具

板凳
AlexYoung757 在职认证  学生认证  发表于 2017-2-13 10:25:10 |只看作者 |坛友微信交流群
二分类用logistics显示的确实是概率 可以这样定义
ifelse(predict >0.5,1,0)
然后再去计算acc或者其他之类的

使用道具

报纸
jameschin007 发表于 2017-2-13 10:28:53 |只看作者 |坛友微信交流群
你先贴一个confusionmatrix 的运行结果出来。

使用道具

地板
jameschin007 发表于 2017-2-13 10:33:52 |只看作者 |坛友微信交流群
tdata 包含ID列了吧。 要去掉啊。 。。。。。。

使用道具

7
yaoqsm321 发表于 2017-2-13 10:40:41 |只看作者 |坛友微信交流群
jameschin007 发表于 2017-2-13 10:33
tdata 包含ID列了吧。 要去掉啊。 。。。。。。
tdata是训练数据啊,去掉就不能训练了吧?

使用道具

8
yaoqsm321 发表于 2017-2-13 10:41:04 |只看作者 |坛友微信交流群
jameschin007 发表于 2017-2-13 10:28
你先贴一个confusionmatrix 的运行结果出来。
我可以问下怎么写这个代码吗,原谅我无知。。。

使用道具

9
jameschin007 发表于 2017-2-13 10:43:58 |只看作者 |坛友微信交流群
data=tdata,label=y
data里全部是变量, lable 是因变量

使用道具

10
jameschin007 发表于 2017-2-13 10:46:24 |只看作者 |坛友微信交流群
yaoqsm321 发表于 2017-2-13 10:41
我可以问下怎么写这个代码吗,原谅我无知。。。
confusionMatrix(model, iris$Species)

大哥, 百度一下就好啊。    Caret 包里。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-12 15:12