4183 5

[问答] R语言中svm问题 [推广有奖]

  • 8关注
  • 1粉丝

博士生

78%

还不是VIP/贵宾

-

威望
0
论坛币
436 个
通用积分
0.0602
学术水平
5 点
热心指数
5 点
信用等级
0 点
经验
4549 点
帖子
164
精华
0
在线时间
407 小时
注册时间
2015-11-3
最后登录
2020-2-8

楼主
露露的家园2012 发表于 2018-1-22 09:19:33 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位,我想问问使用svm去做二分类是不是对预测数据有着严格的限制呢。我这几天用一个svm的模型去二分类,出现了“test data does not match this model”,能不能跟我解释一样。这个是我原始数据的情况:
  1. > summary(new_p6)
  2.   product_no         param1             param2          param4             param3      
  3. Length:32482859    1   : 7655435   4      :15139704   1   :31122586   Min.   :  1.0   
  4. Class :character   2   :14368356   5      : 5200308   2   :   27980   1st Qu.:  7.0   
  5. Mode  :character   3   : 9126775   1      : 4859871   NA's: 1332293   Median : 18.0   
  6.                     5   :       0   3      : 3367277                   Mean   : 25.9   
  7.                     NA's: 1332293   2      : 2487705                   3rd Qu.: 38.0   
  8.                                     (Other):   95701                   Max.   :139.0   
  9.                                     NA's   : 1332293                   NA's   :1332293  
  10.   param5          param6             param7            param8         param9        
  11. 1   :  509271   1   : 5346827   Min.   :  0       Min.   :  0.0     1   :13989404  
  12. 2   : 5355947   2   :25775759   1st Qu.: 60       1st Qu.:369.0     2   :17161162  
  13. 3   :25257368   3   :   27980   Median : 90       Median :370.0     3   :       0  
  14. 5   :   27980   NA's: 1332293   Mean   : 93       Mean   :374.2     4   :       0  
  15. NA's: 1332293                   3rd Qu.:130       3rd Qu.:409.0     NA's: 1332293  
  16.                                  Max.   :600       Max.   :601.0                    
  17.                                  NA's   :1332293   NA's   :1340707                  
  18. param10           param_name        param_value     
  19. 1   :31150566   24     : 1502912   Min.   :-81.8   
  20. 4   :       0   25     : 1492312   1st Qu.: 22.4   
  21. NA's: 1332293   3      : 1355397   Median : 25.3   
  22.                  22     : 1326019   Mean   : 40.0   
  23.                  23     : 1318113   3rd Qu.: 26.6   
  24.                  (Other):24154399   Max.   :550.0   
  25.                  NA's   : 1333707   NA's   :1333707  
  26. > set.seed(2)
  27. > u1<-sample(dim(new_p6)[1],round(0.001*dim(new_p6)[1]))
  28. > dta_1<-new_p6[u1,]
  29. > fit_1<-predict(fit,newdata=dta_1[,2:13])
  30. Error in predict.svm(fit, newdata = dta_1[, 2:13]) :
  31.   test data does not match model !
复制代码
  1. > dta_1
  2.                product_no param1 param2 param4 param3 param5 param6 param7 param8 param9 param10
  3. 6290358    312-161202-007      3      4      1     45      3      2     60    410      1       1
  4. 25727899   345-161203-005      2      5      1      3      3      2    130    300      2       1
  5. 19675857   334-161225-071      2      3      1     16      2      1     90    399      1       1
  6. 5743660    310-161226-081      3      4      1      1      3      2     90    369      1       1
  7. 33957681   358-161218-050      2      1      1      1      3      2     90    400      2       1
  8. 33945845   358-161218-050      2      1      1      1      3      2     90    400      2       1
  9. 4416847    308-161202-006      1      4      1     32      3      2     60    410      1       1
  10. 30072514   352-161224-062      2      1      1     21      3      2    130    370      1       1
  11. 15992245   327-161208-024      2      4      1     20      3      2     60    430      1       1
  12. 18897946   333-161204-012      2      4      1     23      3      2     60    430      2       1
  13. 18985335   333-161207-022      2      4      1     33      3      2    130    310      1       1
  14. 8054328    314-161211-030      3      4      1     24      3      2     60    430      1       1
  15. 27653284   347-161226-080      2      4      1     16      3      2     90    370      2       1
  16. 6158407    311-161229-093      2      4      1     62      3      2     90    370      2       1
  17. 13672662   323-161230-094      2      4      1     12      3      2     90    370      2       1
  18. 30733950   353-161223-066      1      4      1     11      3      2    130    370      2       1
  19. 35015295   359-161230-086      3      1      1     20      3      2     90    370      1       1
  20. 7629800    313-161227-082      1      4      1     51      3      2     90    369      2       1
  21. 14956614   325-161228-085      3      4      1      7      3      2     90    369      1       1
  22. 2628267    305-161219-053      2      4      1     28      3      2     90    370      2       1
  23. 24090644   342-161224-062      1      5      1      1      3      2    130    370      1       1
  24. NA.523268            <NA>   <NA>   <NA>   <NA>     NA   <NA>   <NA>     NA     NA   <NA>    <NA>
  25. 30184267   352-161228-074      2      1      1     33      3      2     90    370      1       1
  26. 5164580    310-161201-003      3      5      1      8      3      2     60    410      1       1
  27. 11778937   320-161206-018      2      4      1     34      3      2     60    430      1       1
  28. 16728480   330-161202-003      2      4      1      1      3      2     60    410      2       1
  29. 5123827    308-161231-096      1      2      1      2      2      1     90    389      1       1
  30. 12106352   320-161222-069      2      4      1     85      3      2     90    370      2       1
  31. 34568511   359-161209-022      3      5      1     11      3      2    130    310      1       1
  32. 4521216    308-161206-017      1      4      1     43      3      2     60    429      2       1
  33. 338294     301-161218-056      2      4      1     29      3      2     90    370      1       1
  34. 5632904    310-161222-069      3      4      1     40      3      2     90    370      2       1
  35. 29308171   351-161223-062      1      1      1     30      3      2    130    370      2       1
  36. 31240149   354-161223-046      3      4      1     27      3      2     90    370      2       1
  37. 17680641   331-161218-053      3      4      1     19      3      2     90    400      2       1
  38. 22908543   341-161204-013      3      3      1     20      2      1    130    310      1       1
  39. 30429182   353-161207-016      2      5      1      6      3      2    130    310      1       1
  40. 9547754    316-161219-057      1      2      1      1      2      1     90    370      1       1
  41. 24263676   342-161229-076      1      5      1      1      3      2     90    369      1       1
  42. 5163550    310-161201-003      3      5      1      8      3      2     60    410      1       1
  43. 35188408   360-161206-013      3      5      1      2      3      2    130    310      2       1
  44. 10137312   317-161210-028      3      4      1      3      3      2     60    429      2       1
  45. 3959654    307-161211-030      3      4      1      6      3      2     60    430      1       1
  46. 5577093    310-161220-063      3      4      1     34      3      2     90    370      1       1
  47. 33964257   358-161220-051      2      1      1      2      3      2     90    400      2       1
  48. 28810263   350-161231-093      3      2      1      9      2      1     90    390      1       1
  49. 34959730   359-161228-080      3      1      1     14      3      2     90    370      1       1
  50. 11837931   320-161208-024      2      4      1     40      3      2     60    430      2       1
  51. 17157146   330-161226-072      2      4      1     41      3      2     90    369      2       1
  52. 29314834   351-161223-062      1      1      1     30      3      2    130    370      2       1
  53. 230922     301-161209-027      2      4      1     48      3      2     60    430      2       1
  54. 486437     301-161223-071      2      4      1     44      3      2     90    370      1       1
  55. 25097324   344-161202-005      2      3      1      7      2      1     60    410      1       1
  56. 33217029   357-161219-057      1      1      1     51      3      2     90    400      2       1
  57. 9240162    316-161202-004      1      5      1      9      3      2    110    299      1       1
  58. 29362338   351-161225-067      3      1      1      1      3      2     90    399      2       1
  59. 28518407   350-161221-063      2      5      1     52      3      2     90    370      2       1
  60. 35421450   360-161220-056      3      1      1      2      3      2     90    369      2       1
  61. 22315582   339-161207-020      3      3      1     14      2      1    130    310      2       1
  62. 25981645   345-161218-048      2      5      1      3      3      2     90    400      2       1
  63. 28003507   349-161211-035      3      4      1     44      3      2    130    310      2       1
  64. 31828840   355-161220-053      3      1      1     34      3      2     90    369      2       1
  65. 22841156   341-161202-006      3      3      1     13      2      1     60    410      1       1
  66. 8749633    315-161210-028      2      4      1     26      3      2     60    430      2       1
  67. 30913406   353-161230-084      2      1      1     12      3      2     90    368      2       1
  68. 14718800   325-161219-061      2      4      1     65      3      2     90    370      1       1
  69. NA.542602            <NA>   <NA>   <NA>   <NA>     NA   <NA>   <NA>     NA     NA   <NA>    <NA>
  70. 15498814   326-161220-061      2      4      1      1      3      2     90    370      1       1
  71. 7388049    313-161219-057      1      4      1     26      3      2     90    370      2       1
  72. 2334494    305-161204-010      2      4      1     13      3      2     60    430      2       1
  73. 9249901    316-161202-005      1      5      1     10      3      2    130    300      2       1
  74. 10580607   317-161231-091      3      5      1      4      3      2     90    390      1       1
  75. 1389356    303-161229-083      1      4      1     18      3      2     90    369      2       1
  76. 6283576    312-161202-007      3      4      1     45      3      2     60    410      1       1
  77. 6241340    311-170101-001      2      4      1     71      3      2     90    388      1       1
  78. 27489217   347-161220-063      2      2      1     25      2      1     90    370      2       1
  79.            param_name   param_value
  80. 6290358             6  2.575016e+01
  81. 25727899            8  2.418540e+01
  82. 19675857           11  2.660639e+01
  83. 5743660             5  2.474012e+01
  84. 33957681            7  2.471572e+01
  85. 33945845           20  3.519604e+01
  86. 4416847             5  2.587998e+01
  87. 30072514           21  3.136111e+02
  88. 15992245            6  2.417725e+01
  89. 18897946           23  1.718765e+00
  90. 18985335           19  2.460573e+01
  91. 8054328            12  2.469091e+01
  92. 27653284           17  2.582163e+01
  93. 6158407            24  4.727952e+00
  94. 13672662           15  3.017999e+01
  95. 30733950            2  1.164028e+02
  96. 35015295           14  2.461869e+01
  97. 7629800            17  2.581998e+01
  98. 14956614           11  2.509000e+01
  99. 2628267            25  2.861023e+00
  100. 24090644            9  2.529216e+01
  101. NA.523268        <NA>            NA
  102. 30184267            3  1.221369e+01
  103. 5164580            22  1.726184e+00
  104. 11778937           10  3.108998e+01
  105. 16728480           16  2.200007e+01
  106. 5123827            11  2.597124e+01
  107. 12106352           14  2.362197e+01
  108. 34568511           13  2.537687e+01
  109. 4521216            24  5.078697e-02
  110. 338294              1  1.268997e+02
  111. 5632904            17  2.549294e+01
  112. 29308171           23  1.723368e+00
  113. 31240149           25  2.398362e+00
  114. 17680641            2  1.279625e+02
  115. 22908543           21  2.909838e+02
  116. 30429182           23  1.709720e+00
  117. 9547754             6  2.337999e+01
  118. 24263676           12  2.621521e+01
  119. 5163550            21  3.329109e+02
  120. 35188408           10  2.671000e+01
  121. 10137312            1  1.301458e+02
  122. 3959654             4  2.821405e+01
  123. 5577093            23  1.713770e+00
  124. 33964257            4  2.600653e+01
  125. 28810263            6  2.509091e+01
  126. 34959730            9  2.556014e+01
  127. 11837931           20  3.510778e+01
  128. 17157146            2  1.301524e+02
  129. 29314834           12  2.699658e+01
  130. 230922             10  2.493999e+01
  131. 486437              7  2.320003e+01
  132. 25097324           11  2.724579e+01
  133. 33217029           20  3.484303e+01
  134. 9240162            14  2.452983e+01
  135. 29362338           12  2.709913e+01
  136. 28518407           16  2.531995e+01
  137. 35421450            4  2.506008e+01
  138. 22315582            9  2.556285e+01
  139. 25981645           11  2.591896e+01
  140. 28003507            1  1.303692e+02
  141. 31828840           23  1.697196e+00
  142. 22841156            5  2.603767e+01
  143. 8749633            10  2.481993e+01
  144. 30913406           15  2.445819e+01
  145. 14718800            2  1.301053e+02
  146. NA.542602        <NA>            NA
  147. 15498814            5  2.494073e+01
  148. 7388049            25  4.291814e-02
  149. 2334494            15  2.329044e+01
  150. 9249901             1  1.306899e+02
  151. 10580607           12  2.570998e+01
  152. 1389356            12  2.624000e+01
  153. 6283576            24  2.682654e+00
  154. 6241340            15  2.541069e+01
  155. 27489217           24  8.739304e+00
  156. [到达getOption("max.print") -- 略过32407行]]
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
yywan0913 在职认证  发表于 2018-1-22 10:54:00
  1. 你的fit是什么?   predict是对你的test数据进行预测,但没看到你的训练集数据的train
复制代码

藤椅
露露的家园2012 发表于 2018-1-22 11:05:37
yywan0913 发表于 2018-1-22 10:54
  1. fit<-svm(label~.,data=train_asb)
复制代码

板凳
露露的家园2012 发表于 2018-1-22 11:07:12
yywan0913 发表于 2018-1-22 10:54
训练集,跟dta1差不多,只是多出了label这一列

报纸
jgchen1966 发表于 2018-1-22 11:43:47
     train data 与test data 可能不相一致:或者类型不同。或者,从你数据显示的瞧,更可能,很多变量是离散的(即仅几个不同数值),在随机取样为tgrain data,和 test data 时,多项变量,不经意间,成了二项变量。。svm函数内部,缺失设置情况下,会自动scale,但对二项变量不scale。这是,在kernlab中的ksvm是明确的,但e1071的svm没有明确,但估计也会这样。。

   
已有 1 人评分经验 热心指数 收起 理由
cheetahfly + 30 + 1 热心帮助其他会员

总评分: 经验 + 30  热心指数 + 1   查看全部评分

地板
jameschin007 发表于 2018-1-22 22:56:27
可能是test data里因子 的取值 在traindata 里没有,模型就不match了。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-8 08:04