- 阅读权限
- 255
- 威望
- 0 级
- 论坛币
- 6270 个
- 通用积分
- 7.5559
- 学术水平
- 0 点
- 热心指数
- 0 点
- 信用等级
- 0 点
- 经验
- 470 点
- 帖子
- 40
- 精华
- 0
- 在线时间
- 72 小时
- 注册时间
- 2011-11-26
- 最后登录
- 2020-8-31
大专生
还不是VIP/贵宾
- 威望
- 0 级
- 论坛币
- 6270 个
- 通用积分
- 7.5559
- 学术水平
- 0 点
- 热心指数
- 0 点
- 信用等级
- 0 点
- 经验
- 470 点
- 帖子
- 40
- 精华
- 0
- 在线时间
- 72 小时
- 注册时间
- 2011-11-26
- 最后登录
- 2020-8-31
| 开心 2020-3-26 09:55:52 |
---|
签到天数: 1 天 连续签到: 1 天 [LV.1]初来乍到
|
相似文件
换一批
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
书籍是:谢佳标老师的《游戏 数据分析R语言实现》,采用kmeans提取离群值,我照着教材一遍结果不理想。求教老师,是这种方法的问题吗。我自己复制教材的code的话,结果反而理想些。麻烦看看我写的哪错了?
玩家玩牌数据样本.zip
(4.5 KB)
本附件包括:
- w<-read.csv("玩家玩牌数据样本.csv",T)
- u<-round(apply(w[,-1],2,function(x) (x-min(x))/(max(x)-min(x))),4)
- u<-data.frame(u)
- row.names(u)<- w$用户id
- head(u)
- kmeans.result<-kmeans(u,3)
- centers<-kmeans.result$centers[kmeans.result$cluster,]
- distance<-sqrt(rowSums((u-centers)^2))
- outliers<-order(distance,decreasing = T)[1:5]
- print(outliers)
- rownames(u[outliers,])
- plot(u$玩牌局数,u$正常牌局,pch=kmeans.result$cluster,xlab="玩牌局数",ylab="正常牌局",x=aexs=F)
- plot(u$玩牌局数,u$正常牌局,pch=kmeans.result$cluster,xlab="玩牌局数",ylab="正常牌局",aexs=F)
- text(u[outliers,'玩牌局数'],u[outliers,'正常牌局'],labels=rownames(u[outliers,]),cex=1.2,col="gold")
- points(kmeans.result$centers[,c('玩牌局数','正常牌局')],cex=1,col=4,pch="*")
- points(u[outliers,c('玩牌局数','正常牌局')],cex=1.2,col="red",pch=1)
复制代码
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|
|
-
总评分: 论坛币 + 20
查看全部评分
|