楼主: wqjqqxq
6414 4

[clementine] clementine中特征选择即Feature Selection 的算法 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

8%

还不是VIP/贵宾

-

威望
0
论坛币
1126 个
通用积分
0.3207
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
997 点
帖子
42
精华
0
在线时间
225 小时
注册时间
2009-4-28
最后登录
2022-2-24

楼主
wqjqqxq 发表于 2011-3-15 16:19:42 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
因做毕业论文要用,如果没有具体的算法话无法在论文中使用,求助各位,多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:clementine Selection clementin Election feature clementine 算法 Selection feature 特征选择

沙发
yaozhiyan 发表于 2011-3-16 13:38:21
具体的算法可以到网上找材料啊,你要是想论文做应用的话,直接用clementine软件去实行不就可以了啊
努力,再努力!

藤椅
夏夜风暖 发表于 2014-12-25 00:45:03
【转自】基于clementine的数据挖掘
clementine上的特征选择:
1. 从变量自身考察:重要的变量应该是携带信息较多,也就是变量值差异较大的变量【这个用统计上来表示,就是标准差、变异系数之类】so ,clementine的参考标准是
(1)数值型变量变异系数小于某阀值,则该变量视为不重要变量
(2)数值型变量标差小于某阀值,则该变量不重要
(3)分类型变量若某类别值的个数大于某阀值,则该变量不重要
(4)分类型变量若类别值的数量大于某阀值,则该变量不重要
2. 从输入变量和输出变量相关性角度考虑
就是计算 pearson相关系数,方差分析,卡方检验,分别对应2变量类型 为数值×类别
而重要性 不是相关系数的大小,而是相关系数的t检验的1-p值的大小,1-p的值越大,那么相关系数表示的相关性值越可靠,这个输入变量越重要;同理,方差分析,卡方检验,也是通过比较1-F值得到的p的值,越大表示该变量越重要

板凳
kuangsir6 发表于 2015-1-3 13:47:03
夏夜风暖 发表于 2014-12-25 00:45
【转自】基于clementine的数据挖掘
clementine上的特征选择:
1. 从变量自身考察:重要的变量应该是携带信 ...
讲得好!
不过,其他模型中出现的变量重要性不都是只看1-p的大小的。

报纸
kuangsir6 发表于 2015-1-3 13:51:18
IBM SPSS Modeler 15(原Clementine)的算法链接:
https://bbs.pinggu.org/thread-3192274-1-1.html

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-31 01:15