最近一直在看Map/Reduce的东西,按照mapreduce
也实现了字数统计的分布式处理,明白了其中的原理。于是想,能否将此方法用于文本聚类上来(我自己写了一个简单的文本聚类方法,依据2文档中出现相同字符的频率,效率不高,但是准确度还是不错的),
以便能处理数量更为庞大的聚类。但是没有想到将这二者结合的点。有没有精通此道的,给点建议。。。。。。。。
|
楼主: googya
|
3064
4
Map/Reduce架构能用于文本聚类么? |
|
大专生 48%
-
|
| ||
|
|
| ||
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


