楼主: 阿璇tian
1331 1

[问答] R语言k近邻法预测结果太差怎么回事 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

89%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
2.8713
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1959 点
帖子
121
精华
0
在线时间
195 小时
注册时间
2017-12-21
最后登录
2023-3-27

楼主
阿璇tian 发表于 2018-10-12 17:32:49 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
  1. library(dplyr)
  2. fdata$ratio<- fdata$L1Y_Flight_Count/fdata$P1Y_Flight_Count
  3. pre<- filter(fdata,FLIGHT_COUNT>6)
  4. pre<- select(fdata,c("FFP_TIER","AVG_INTERVAL","avg_discount","EXCHANGE_COUNT","ratio"))
  5. pre$ratiotype<- as.factor(ifelse(pre$ratio<0.5,"已流失",ifelse((pre$ratio>=0.5 &  pre$ratio<0.9),"准流失","未流失")))
  6. pre<- pre[,-5]
  7. table(pre$ratiotype)
  8. summary(pre)
  9. pre2<- scale(pre[,-5])
  10. pre<- data.frame(pre2,pre$ratiotype)
  11. names(pre)

  12. #训练集、测试集
  13. set.seed(12345)
  14. a<- sample(2,nrow(pre),replace = TRUE,prob = c(0.8,0.2))
  15. train<- pre[a==1,]
  16. test<- pre[a==2,]
  17. str(train$pre.ratiotype)
  18. table(train$pre.ratiotype)

  19. # k近邻法
  20. library(class)
  21. knn.model<- knn(train[,-5],test[,-5],train$pre.ratiotype,k=7)
  22. summary(knn.model)
  23. tab<- table(test$pre.ratiotype,knn.model,dnn = c("acctual","predict"))
  24. sum(diag(tab))*100/sum(tab)
复制代码



准确率只有53%,请问是哪里的问题呢?
数据结构如下:


2.png

对测试集的预测结果如下:

1.png

还有一个问题,什么时候对自变量进行标准化呢,这里标准化和不标准化我都试了一下,结果没有区别

请老师们指导!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:R语言 Library ratio BRARY dplyr

沙发
阿璇tian 发表于 2018-10-15 16:47:59
顶一下!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 12:14