楼主: iRoss
6096 5

[问答] 如何在text miner中解析中文 [推广有奖]

  • 0关注
  • 0粉丝

小学生

7%

还不是VIP/贵宾

-

威望
0
论坛币
2 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
36 点
帖子
3
精华
0
在线时间
5 小时
注册时间
2012-6-1
最后登录
2019-7-20

楼主
iRoss 发表于 2012-6-3 23:27:20 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
下了个带text miner 5.1 的版本,sid中不含中文模块,不过有困难也要上不是!小弟这样想:既然sas只能对英文进行解析,那么可不可以先用分词包将中文分好词,然后将每个词用拼音代词,词与词之间用空格分开。这样text miner看到拼音就能把它当作英文了,然后就可以进行聚类、分类等一系列工作。

不知这种想法可行不可行?求高手鉴定!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Miner Text MINE ext Min 中文 如何

沙发
yanziwoaini 发表于 2012-6-3 23:34:28
同求

藤椅
石瑞 在职认证  发表于 2012-6-4 00:18:42
关注
假如爱有天意!

板凳
iRoss 发表于 2012-6-4 00:35:56
已经测试!这种方法是可以的!只不过最终看结果时是用拼音显示的,会很让人抓狂……

另外,分词我用的java包是IKAnalyzer,中文转拼音的java包是pinyin4j。pinyin4j这个包挺好用的,就是对于一些词组和多音字无能为力,很是头大

报纸
邮编无忧网 发表于 2012-6-11 11:31:01
邮编无忧网 对中文地址进行模糊匹配 算text mining 吗

地板
hgz2373294 发表于 2015-1-9 21:59:44
sas ccs 中有中文配套的

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-2 00:03