楼主: ccc0556
13478 15

[问答] R软件中——决策树(分类与回归树)分析疑问 [推广有奖]

  • 1关注
  • 6粉丝

已卖:2483份资源

博士生

77%

还不是VIP/贵宾

-

威望
0
论坛币
6310 个
通用积分
17.6600
学术水平
7 点
热心指数
3 点
信用等级
1 点
经验
1459 点
帖子
203
精华
0
在线时间
375 小时
注册时间
2008-10-8
最后登录
2019-1-27

楼主
ccc0556 发表于 2012-7-16 22:34:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如果一组数据样本事先无分类信息,但是根据已有的文献研究可以大致的将其划分为5类,并且每组样本是否属于哪一类事先也不知道。

问题就是如果想将这些样本划分到上述5类中的某一类,有什么统计方法没?
可以用分类与回归树的方法么?
ths。

望指点?谢谢!

eg:分类与回归树,资料来源:http://www.statmethods.net/advstats/cart.html
Classification Tree example Let's use the data frame kyphosis to predict a type of deformation (kyphosis) after surgery, from age in months (Age), number of vertebrae involved (Number), and the highest vertebrae operated on (Start).
# Classification Tree with rpart
library(rpart)

# grow tree
fit <- rpart(Kyphosis ~ Age + Number + Start,
   method="class", data=kyphosis)

printcp(fit) # display the results
plotcp(fit) # visualize cross-validation results
summary(fit) # detailed summary of splits

# plot tree
plot(fit, uniform=TRUE,
   main="Classification Tree for Kyphosis")
text(fit, use.n=TRUE, all=TRUE, cex=.8)

# create attractive postscript plot of tree
post(fit, file = "c:/tree.ps",
   title = "Classification Tree for Kyphosis")

疑问:这里的Kyphosis是事先已分类好的变量吗?如果没有这个事先已分类好的因变量还可以做决策树分析吗?



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:r软件 决策树 formation involved Methods 软件 分析法 因变量

沙发
ccc0556 发表于 2012-7-16 22:43:11
求高手指点一二,不甚感激》

藤椅
wyfhdl 发表于 2012-7-17 08:43:35
ccc0556 发表于 2012-7-16 22:43
求高手指点一二,不甚感激》
。。不就是。。聚类么。。亲。。
犯我华者 虽远必诛

板凳
ccc0556 发表于 2012-7-17 09:20:31
wyfhdl 发表于 2012-7-17 08:43
。。不就是。。聚类么。。亲。。
ths~聚类也有不同的方法啊,这里主要想用的是分类与回归树的方法做分类,spss里面有CART这个选项,但好像需要事先有因变量的分类信息才行。

报纸
trier2006 发表于 2012-7-17 09:36:09
友情帮顶
最好的医生是自己,最好的药物是时间……

地板
woodlee 发表于 2012-7-17 10:50:37
嗯,这个想法不错,顶一下。

7
ccc0556 发表于 2012-7-18 09:29:57
trier2006 发表于 2012-7-17 09:36
友情帮顶
谢谢

8
ltx5151 发表于 2012-7-18 20:47:09
ccc0556 发表于 2012-7-17 09:20
ths~聚类也有不同的方法啊,这里主要想用的是分类与回归树的方法做分类,spss里面有CART这个选项,但好像 ...
说实话,没太明白您的意思。但是分类和聚类是不一样的,不可混为一谈哈。你用CART,就是分类与回归树,是用来做分类的,不是聚类的。一个supervised learning,一个是unsupervised problem。

9
ccc0556 发表于 2012-7-18 22:09:58
刚查了一下:分类是指有监督的学习,即要分类的样本是有标记的,类别是已知的;聚类是指无监督的学习,样本没有标记,根据某种相似度度量把样本聚为k类。

那么如果一组数据样本事先无分类信息,但是根据已有的文献研究可以大致的将其划分为5类,并且每组样本是否属于哪一类事先也不知道。

问题就是如果想将这些样本划分到上述5类中的某一类,有什么统计方法没?
ths。

10
ccc0556 发表于 2012-7-27 16:38:06
求解----

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-3 20:35