楼主: gaaygaay
7483 20

[学科前沿] [求助]恳求离散化之ChiMerge算法之软件 [推广有奖]

  • 0关注
  • 0粉丝

初中生

33%

还不是VIP/贵宾

-

威望
0
论坛币
50 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
175 点
帖子
22
精华
0
在线时间
0 小时
注册时间
2007-10-25
最后登录
2008-4-21

楼主
gaaygaay 发表于 2007-10-25 12:16:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
<p class="MsoNormal" style="MARGIN: 0cm 0cm 0pt;"><font size="3"><span lang="ZH-CN" style="FONT-FAMILY: SimSun; mso-ascii-font-family: 新細明體; mso-hansi-font-family: 新細明體; mso-fareast-language: ZH-CN;">如提</span><span lang="EN-US" style="FONT-FAMILY: 新細明體; mso-fareast-language: ZH-CN; mso-fareast-font-family: SimSun;">~</span><span lang="ZH-CN" style="FONT-FAMILY: SimSun; mso-ascii-font-family: 新細明體; mso-hansi-font-family: 新細明體; mso-fareast-language: ZH-CN;">请好心人提供用来解离散化之</span><span lang="EN-US" style="FONT-FAMILY: 新細明體; mso-fareast-language: ZH-CN; mso-fareast-font-family: SimSun;">ChiMerge</span><span lang="ZH-CN" style="FONT-FAMILY: SimSun; mso-ascii-font-family: 新細明體; mso-hansi-font-family: 新細明體; mso-fareast-language: ZH-CN;">或</span><span lang="EN-US" style="FONT-FAMILY: 新細明體; mso-fareast-language: ZH-CN; mso-fareast-font-family: SimSun;">Chi2</span><span lang="ZH-CN" style="FONT-FAMILY: SimSun; mso-ascii-font-family: 新細明體; mso-hansi-font-family: 新細明體; mso-fareast-language: ZH-CN;">的软件包</span><span lang="EN-US" style="FONT-FAMILY: 新細明體;"><p></p></span></font></p><p class="MsoNormal" style="MARGIN: 0cm 0cm 0pt;"><font size="3"><span lang="ZH-CN" style="FONT-FAMILY: SimSun; mso-ascii-font-family: 新細明體; mso-hansi-font-family: 新細明體; mso-fareast-language: ZH-CN;">小弟我到处都找不着</span><span lang="EN-US" style="FONT-FAMILY: 新細明體; mso-fareast-language: ZH-CN; mso-fareast-font-family: SimSun;">…</span><span lang="ZH-CN" style="FONT-FAMILY: SimSun; mso-ascii-font-family: 新細明體; mso-hansi-font-family: 新細明體; mso-fareast-language: ZH-CN;">急需</span><span lang="EN-US" style="FONT-FAMILY: 新細明體; mso-fareast-language: ZH-CN; mso-fareast-font-family: SimSun;">!!</span><span lang="EN-US" style="FONT-FAMILY: 新細明體;"><p></p></span></font></p><span lang="ZH-CN" style="FONT-SIZE: 12pt; FONT-FAMILY: SimSun; mso-ascii-font-family: 新細明體; mso-hansi-font-family: 新細明體; mso-fareast-language: ZH-CN; mso-font-kerning: 1.0pt; mso-bidi-font-family: "Times New Roman"; mso-ansi-language: EN-US; mso-bidi-language: AR-SA;">请大家帮忙了</span><span lang="EN-US" style="FONT-SIZE: 12pt; FONT-FAMILY: 新細明體; mso-fareast-language: ZH-CN; mso-fareast-font-family: SimSun; mso-font-kerning: 1.0pt; mso-bidi-font-family: "Times New Roman"; mso-ansi-language: EN-US; mso-bidi-language: AR-SA;">~~</span>
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:ChiMerge Merge IME him 离散化 好心人 软件包

沙发
yiyo900 发表于 2007-10-25 17:08:00

软件R有个package "dprep"

主要功能是 normalization,treatment of missing values,discretization

          outlier detection,feature selection,and visualization

其中就有一个function chiMerge 就是你要的.

           Discretization using the Chi-Merge method.

 

藤椅
gaaygaay 发表于 2007-10-25 17:18:00

回复:(yiyo900)软件R有个package dprep主要功能是...

非常感谢您!!!不过您说的软件R是指? 请问有详细的软件介绍吗!?

[此贴子已经被作者于2007-10-25 17:29:08编辑过]

板凳
southmm 发表于 2007-10-25 17:34:00

报纸
gaaygaay 发表于 2007-10-25 20:56:00

感谢两位的回答!!!

那我再请问~有关于CHI2的软件吗???

还有其它可以执行ChiMerge的软件吗???

地板
yiyo900 发表于 2007-10-26 20:22:00

统计软件都可算CHI2.

chiMerge顾名思义是在过程中,计算2adjacent intervals

CHI2threshold value比较,以兹判断是否merge.

R软件的chiMerge(),程序写的很简洁,也很实用.

你可先下载dprep_1.0.tar.gz参考.

 http://cran.r-project.org/src/contrib/Descriptions/dprep.html

若有需要,我可提供ChiMerge Algorithm含计算过程供参考.

7
gaaygaay 发表于 2007-10-29 03:29:00

首先还是要先感谢大大的回复!!

我明白统计软件都可以算chi-square~

不过我所指的Chi2不等于chi-square, 是指chiMerge的演进,是由Huan Liu and Rudy Setiono针对chiMerge所做的改进,

他们改进的地方为此方法不用固定的显著水平(sigLevel),而是使显著水平逐渐下降.

而我所需要的软件是希望自动把至少100笔的数据自动两两做chi-square进而

自动将最低的值合并,再自动再次运算,直到设定的群组数为止,R软件能做到吗???

另外我也希望你能分享ChiMerge Algorithm含计算过程供参考,能在包含操作过程吗??


[此贴子已经被作者于2007-10-29 3:38:44编辑过]

8
yiyo900 发表于 2007-10-29 08:00:00

1.你指的应该是这篇文献

 "Chi2: Feature Selection and Discretization of Numeric Attributes"

       Huan Liu, Rudy Setiono

 这个有C++  source code

 CHIMERGE.tar

 Chi2.tar    

 http://www.public.asu.edu/~huanliu/FSBOOK/TOOLS/DISCRETIZER/

 http://www.public.asu.edu/~huanliu/FSBOOK/TOOLS/DISCRETIZER/

2.至於R運作,

 以iris data,sepal-length 150 obs为例说明

 设alpha=0.05  class=3

 则threshold=qchisq(1-alpha,class-1)=5.991465

 经sort,define intervals,..后得到下列数据,

 两两做chi-square,将最低的值合并,再次运算,

 直到皆大于threshold.

                1 2 3

4.30+ thru 4.35 1 0 0

4.35+ thru 4.45 3 0 0

4.45+ thru 4.55 1 0 0

4.55+ thru 4.65 4 0 0

..................... 

7.65+ thru 7.80 0 0 4

7.80+ thru 7.90 0 0 1

结果如下:

chi-sqare=[30.90553 17.84705 9.07365]

cutpoint=[5.45 5.75 7.05]

midpoint=[4.30 5.45 5.75 7.05 7.90]

 

 

[此贴子已经被作者于2007-10-29 14:43:17编辑过]

9
gaaygaay 发表于 2007-10-29 17:14:00

1.      对对对!!!就是那篇paper!

那是他自己所写的c++对吧!你怎么找到的阿!真是太厉害了

所以说~Chi2就没有套装可以用了吧!?

2.      请问iris data,sepal-length的数据哪里可以下载吗??我是刚升上硕一的新生,所以很多数据都不知道能去哪里找呢~@@”

先感谢您呢!!那我就先来试试看!!有问题我在请问您搂!!

10
yiyo900 发表于 2007-10-29 19:53:00

Available Data Sets

http://www.math.tau.ac.il/~mansour/ml-course/

ChiMerge technique  168766.pdf (222.13 KB)


[此贴子已经被作者于2007-10-30 8:04:21编辑过]

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-9 06:33