楼主: 90°S
19638 14

[学习分享] ChiMerge基于卡方的离散化方法(R语言实现鸢尾花数据集的离散化) [推广有奖]

  • 0关注
  • 0粉丝

已卖:450份资源

大专生

18%

还不是VIP/贵宾

-

威望
0
论坛币
2409 个
通用积分
28.3574
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
714 点
帖子
19
精华
0
在线时间
44 小时
注册时间
2014-12-31
最后登录
2021-5-14

楼主
90°S 学生认证  发表于 2015-9-18 22:46:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
最近学习数据挖掘,参考网上和相关资料,分享一下自己的一些学习成果。

鸢尾花数据集的离散化与数据挖掘中的ChiMerge算法相关,用R语言实现。
相关性度量也可以用于离散化,ChiMerge基于卡方的离散化方法

问题描述:
ChiMerge是监督的、自底向上的数据离散化方法。它依赖于卡方分析:具有最小卡方值的相邻区间合并在一起,直到满足确定的停止标准。

(1)、简述ChiMerge如何工作。

(2)、取鸢尾花数据集作为待离散化的数据集合,鸢尾花数据集可以从UCI机器学习数据库得到。使用ChiMerge方法,对四个数值属性分别进行离散化。(令停止条件为:max-interval=6)。你需要写一个小程序,以避免麻烦的数值计算。提交你的简要分析和检验结果:分裂点、最终的区间以及源程序文档。
iris.txt (2.68 KB, 需要: 2 个论坛币)
问题分析及回答:

(1)ChiMerge的工作原理:

ChiMerge算法过程:

第一步:初始化:

       根据要离散的属性对实例进行排序;每个实例属于一个区间。

第二步:合并区间,又包括两步骤:

       1、计算每一对相邻区间的卡方值;

       2、将卡方值最小的一对区间合并。

用R软件实现: 鸢尾花R语言.txt (2.96 KB, 需要: 10 个论坛币)
结果如下图
R得到的鸢尾花数据集离散化结果
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:ChiMerge Merge 离散化 鸢尾花 R语言 R语言 鸢尾花 ChiMerge

沙发
yangming98(未真实交易用户) 发表于 2015-9-19 16:14:03 来自手机
90°S 发表于 2015-9-18 22:46
最近学习数据挖掘,参考网上和相关资料,分享一下自己的一些学习成果。

鸢尾花数据集的离散化与数据挖掘 ...
好的?

藤椅
jjxm20060807(未真实交易用户) 发表于 2015-9-19 16:30:08
谢谢分享

板凳
90°S(未真实交易用户) 学生认证  发表于 2015-9-24 14:44:45
yangming98 发表于 2015-9-19 16:14
好的?
代码和数据都是好的,拖进去就可以用了

报纸
lilac____(未真实交易用户) 发表于 2015-10-31 16:48:41
初学者

地板
夏日星小屋(真实交易用户) 发表于 2017-4-3 16:04:53
资料感觉很不错,希望能有用

7
lihongyi12321(真实交易用户) 发表于 2018-3-14 15:28:45
R 里面的chiM {discretization}有这个功能,但是R里是按照p值终止的

8
jgzjwu(真实交易用户) 发表于 2018-5-16 14:11:05
lihongyi12321 发表于 2018-3-14 15:28
R 里面的chiM {discretization}有这个功能,但是R里是按照p值终止的
您好,是用R语言可以解决用卡方分箱吗

9
jgzjwu(真实交易用户) 发表于 2018-5-16 14:12:02
您好,刚刚好像购买了您的资料,但是显示内容错误,不知道什么情况呢,第一次用这个,非常需要您的资料呢

10
jgzjwu(真实交易用户) 发表于 2018-5-16 14:36:45
jjxm20060807 发表于 2015-9-19 16:30
谢谢分享
您好,可以分享一下吗,购买了但是显示内容错误

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-13 08:46