搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  dataset.zip
资料下载链接地址: https://bbs.pinggu.org/a-2194187.html
本附件包括:
  • datasetx.csv
附件大小:
10.85 KB   举报本内容
这两天一直在处理一组数据,探索合适的聚类方法以达到期望的目标,发现基于R现有的常用数据挖掘包(参考帖子http://blog.sina.com.cn/s/blog_99dc1f0a0102vysy.html)的几乎所有算法均不能达到我想要的效果{:3_58:}。。

现在的很是迷茫埃。{:3_55:}求助高手一探究竟。。ps:尝试了去除极端值依旧无法实现

数据的横纵坐标代表的是数据的两个价值维度,数据点越靠近右上角则越优。很明显有三处是集中比较密集的区域,所以我预想的聚类效果应该是这样的:

又或者是这样的分成两类:

然而实际上用kmeans聚出来的是这样的:kmeans(test,3)

一定是我的代码有问题所以我改了下,调整为kmeans(test,3,nstart=30)结果是这样的:

感觉kmeans不靠谱,又用基于密度的dbscan算法试了下:
dbscan(test, eps = 0.01, MinPts = 10)

嗯效果很拙劣。。又试了下传说中的SVM算法,结果是这样的:

很迷茫,求论坛大神指点。。
这是数据
  1. require(graphics)
  2. dataset <- read.csv("C:/Users/Lich/Desktop/dataset.csv",header=T)
  3. test <- dataset[c("z_attention","z_utilization")]
复制代码




    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2026-1-10 16:18