楼主: xun448122177
4557 6

[问答] 系统聚类后,怎么判断测试集数据属于哪一个类? [推广有奖]

  • 0关注
  • 2粉丝

博士生

19%

还不是VIP/贵宾

-

威望
0
论坛币
5972 个
通用积分
4.0500
学术水平
2 点
热心指数
2 点
信用等级
2 点
经验
9927 点
帖子
215
精华
0
在线时间
273 小时
注册时间
2012-9-21
最后登录
2023-11-13

楼主
xun448122177 发表于 2014-10-11 14:37:47 |AI写论文
50论坛币
现在有两个数据集:训练集(train set)和测试集(test set)。
利用proc cluster过程对训练集数据(train set)聚类之后,如何判断测试集数据(test set)中的样本属于哪一类?用SAS怎么实现?
  1. data train;
  2. input id x y;
  3. datalines;
  4. 1     15.4091      1.5491
  5. 2     10.9082     -0.9675
  6. 3     15.3822      1.8183
  7. 4      9.5898     -2.4073
  8. 5      9.9458      0.6724
  9. 6     10.2291     -0.5715
  10. 7      9.6450     -4.0562
  11. 8     11.1216      3.2309
  12. 9      2.0575      3.4359
  13. 10     11.9938      3.7972
  14. 11      9.4967     -4.1008
  15. 12      4.9667      0.6011
  16. 13     11.2794     -0.8699
  17. 14      9.6067     -0.7234
  18. 15     13.0185      0.3925
  19. 16      4.8990     -1.6354
  20. 17     11.1679      0.8643
  21. 18     11.6815      2.3479
  22. 19      8.4027     -3.3714
  23. 20      7.7793     -8.8127
  24. 21     14.3193      5.5325
  25. 22      2.1550      3.5026
  26. 23      8.6603     -2.6741
  27. 24     15.1578      0.5084
  28. 25      8.8174     -2.9932
  29. 26     12.9201     -2.7144
  30. 27      4.6989     -6.6903
  31. 28     11.9450     -4.5623
  32. 29     12.9990     -7.0821
  33. 30     17.3872     -2.0966
  34. 31     15.8118     -2.2684
  35. 32     13.7049     -3.4502
  36. 33     14.4304     -3.6925
  37. 34      5.7314     -7.9326
  38. 35      7.3310     -9.1295
  39. 36      6.4758     -8.3618
  40. 37     -0.7505      1.9121
  41. 38      6.1170     -8.2503
  42. 39      1.9303     -4.5581
  43. 40     13.8314     -6.2995
  44. 41      0.8887     -0.6846
  45. 42      1.0783     -2.7695
  46. 43      4.9339     -9.5764
  47. 44      5.8186     -8.1148
  48. 45     -0.3435      2.8181
  49. 46     12.4756     -1.5845
  50. 47      0.7985      4.9212
  51. 48     14.5799     -2.1837
  52. 49     -2.4897     -3.4639
  53. 50     12.1440    -12.9824
  54. ;
  55. data test;
  56. input id x y;
  57. datalines;
  58. 51      1.0054     -8.2956
  59. 52     -0.3614     -1.2892
  60. 53     -1.3917      3.6621
  61. 54      0.1904      5.2448
  62. 55      3.9498     -0.1230
  63. 56     15.3575     -2.7960
  64. 57     -0.3440      5.5702
  65. 58      0.8296     -4.2619
  66. 59     13.3376     -6.0623
  67. 60      6.0856    -11.3700
  68. ;
  69. run;

  70. proc cluster data=train method=density R=0.5 outtree=outtree ccc pseudo ;/*里面的参数可以随便改*/
  71. var x y;
  72. run;
复制代码


test.txt
下载链接: https://bbs.pinggu.org/a-1646241.html

201 Bytes

train.txt

960 Bytes

关键词:怎么判断 系统聚类 测试集 Cluster Density train 如何 样本

沙发
gzwdw138 发表于 2014-10-11 16:08:54
给数据过来,帮你算出来。

藤椅
xun448122177 发表于 2014-10-11 16:33:50
gzwdw138 发表于 2014-10-11 16:08
给数据过来,帮你算出来。
train set
  1. id,x,y
  2. 1,15.409 ,1.549
  3. 2,10.908 ,-0.967
  4. 3,15.382 ,1.818
  5. 4,9.590 ,-2.407
  6. 5,9.946 ,0.672
  7. 6,10.229 ,-0.572
  8. 7,9.645 ,-4.056
  9. 8,11.122 ,3.231
  10. 9,2.057 ,3.436
  11. 10,11.994 ,3.797
  12. 11,9.497 ,-4.101
  13. 12,4.967 ,0.601
  14. 13,11.279 ,-0.870
  15. 14,9.607 ,-0.723
  16. 15,13.018 ,0.392
  17. 16,4.899 ,-1.635
  18. 17,11.168 ,0.864
  19. 18,11.681 ,2.348
  20. 19,8.403 ,-3.371
  21. 20,7.779 ,-8.813
  22. 21,14.319 ,5.532
  23. 22,2.155 ,3.503
  24. 23,8.660 ,-2.674
  25. 24,15.158 ,0.508
  26. 25,8.817 ,-2.993
  27. 26,12.920 ,-2.714
  28. 27,4.699 ,-6.690
  29. 28,11.945 ,-4.562
  30. 29,12.999 ,-7.082
  31. 30,17.387 ,-2.097
  32. 31,15.812 ,-2.268
  33. 32,13.705 ,-3.450
  34. 33,14.430 ,-3.693
  35. 34,5.731 ,-7.933
  36. 35,7.331 ,-9.130
  37. 36,6.476 ,-8.362
  38. 37,-0.750 ,1.912
  39. 38,6.117 ,-8.250
  40. 39,1.930 ,-4.558
  41. 40,13.831 ,-6.299
  42. 41,0.889 ,-0.685
  43. 42,1.078 ,-2.769
  44. 43,4.934 ,-9.576
  45. 44,5.819 ,-8.115
  46. 45,-0.343 ,2.818
  47. 46,12.476 ,-1.585
  48. 47,0.799 ,4.921
  49. 48,14.580 ,-2.184
  50. 49,-2.490 ,-3.464
  51. 50,12.144 ,-12.982
复制代码
test set
  1. id,x,y
  2. 51,1.005 ,-8.296
  3. 52,-0.361 ,-1.289
  4. 53,-1.392 ,3.662
  5. 54,0.190 ,5.245
  6. 55,3.950 ,-0.123
  7. 56,15.357 ,-2.796
  8. 57,-0.344 ,5.570
  9. 58,0.830 ,-4.262
  10. 59,13.338 ,-6.062
  11. 60,6.086 ,-11.370
复制代码

板凳
xun448122177 发表于 2014-10-11 16:53:28
gzwdw138 发表于 2014-10-11 16:08
给数据过来,帮你算出来。
为了方便,直接写成代码放在上面了。

报纸
gxnnhsd 发表于 2014-10-12 00:30:48
聚类分析没有办法知道。改用判别分析吧!

地板
seven兮 发表于 2014-10-12 10:41:00
用R判别分析

7
xun448122177 发表于 2014-10-12 18:32:54
之前考虑过判别分析,但是行不通。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-27 04:02