楼主: lich.huang@qq.c
2439 6

[实际应用] [求助] 对于聚类方法的选择很是迷茫,使用的聚类方法与期望的效果相去甚远。。 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

小学生

57%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
29 点
帖子
4
精华
0
在线时间
11 小时
注册时间
2015-3-15
最后登录
2017-5-31

楼主
lich.huang@qq.c 学生认证  发表于 2017-2-19 18:45:33 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
这两天一直在处理一组数据,探索合适的聚类方法以达到期望的目标,发现基于R现有的常用数据挖掘包(参考帖子http://blog.sina.com.cn/s/blog_99dc1f0a0102vysy.html)的几乎所有算法均不能达到我想要的效果{:3_58:}。。

现在的很是迷茫啊。。{:3_55:}求助高手一探究竟。。ps:尝试了去除极端值依旧无法实现
Rplot01.png
数据的横纵坐标代表的是数据的两个价值维度,数据点越靠近右上角则越优。很明显有三处是集中比较密集的区域,所以我预想的聚类效果应该是这样的:
期望的结果2.png
又或者是这样的分成两类:
期望的结果1.png
然而实际上用kmeans聚出来的是这样的:kmeans(test,3)
实际的结果1.png
一定是我的代码有问题所以我改了下,调整为kmeans(test,3,nstart=30)结果是这样的:
kmeans(test,3,nstart=30).png
感觉kmeans不靠谱,又用基于密度的dbscan算法试了下:
dbscan(test, eps = 0.01, MinPts = 10)
dbscan(test, eps = 0.01, MinPts = 10).png
嗯效果很拙劣。。又试了下传说中的SVM算法,结果是这样的:
SVMtest.png
很迷茫,求论坛大神指点。。
这是数据 dataset.zip (10.85 KB) 本附件包括:
  • datasetx.csv

  1. require(graphics)
  2. dataset <- read.csv("C:/Users/Lich/Desktop/dataset.csv",header=T)
  3. test <- dataset[c("z_attention","z_utilization")]
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:聚类算法研究 R聚类 数据分析 聚类算法

databox.zip
下载链接: https://bbs.pinggu.org/a-2194118.html

10.85 KB

不要下这个

本附件包括:

  • databox.csv

沙发
1993110 发表于 2017-2-19 19:58:23
你给上述矩形,画上2条对角线,作为辅助线,试试?

进而,再看看用什么、做什么?


不知能不能有什么用途,有什么启发。

藤椅
1993110 发表于 2017-2-19 20:00:54
或者,你在上述矩形内,添加上一个内接的椭圆,进而,看看能做什么?

板凳
1993110 发表于 2017-2-19 20:08:39
上面的图,象灌木丛,进而,可看成树,这个树,有树根部分,树干部分,树枝树叶树冠部分,三部分大体符合一定分布规律,
-------而这,能贴近有关的数学工具。描述大树之类的东西,肯定有数学工具。

-------而有关的数学工具,或许,万一,能够引入到上述图形当中来。


--------而右上方,可看成太阳、阳光。阳光对树枝树叶树冠的分布,是有吸引力的。

报纸
lich.huang@qq.c 学生认证  发表于 2017-2-19 21:21:41
1993110 发表于 2017-2-19 20:08
上面的图,象灌木丛,进而,可看成树,这个树,有树根部分,树干部分,树枝树叶树冠部分,三部分大体符合一 ...
大兄弟。。我也知道,肯定有,“合适的数学工具”能把这三部分,分割出来,但是啊,我也试过把星星、月亮、太阳挡住来做,还是没能成功,这个如何是好。

地板
lich.huang@qq.c 学生认证  发表于 2017-2-19 21:23:27
1993110 发表于 2017-2-19 20:08
上面的图,象灌木丛,进而,可看成树,这个树,有树根部分,树干部分,树枝树叶树冠部分,三部分大体符合一 ...
大兄弟。。我也知道,肯定有,“合适的数学工具”能把这三部分,分割出来,但是啊,我也试过把右上角的星星、月亮、太阳挡住来做,还是没能成功,这个如何是好。

7
1993110 发表于 2017-2-19 22:40:36
lich.huang@qq.c 发表于 2017-2-19 21:21
大兄弟。。我也知道,肯定有,“合适的数学工具”能把这三部分,分割出来,但是啊,我也试过把星星、月亮 ...
大哥,我是外行,就说外行话。


能不能,先把上述矩形,画出2条对角线,从而,有交点,也把矩形分割成了4块,4个区域,


那么,那些数据点,可能靠近上述交点,或者,贴近对角线而主要聚集在某区域,


上述,应该能用数学表达出来吧,



不知道上述设想,是怎样的。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-10 05:02