楼主: 朽木七根
23932 40

[问答] 请问R如何自定词典进行分词 [推广有奖]

31
白头雕007 发表于 2015-12-28 09:40:50
chengyn 发表于 2015-3-16 09:38
错误于installDict("F:\\myword.txt", dictname = "myword", dicttype = "text") :
  Wrong path of th ...
人家安装的是搜狗的词典,所以使用installDict;而你的文件是txt的,不需要安装,最简单的就是直接放在Rwordseg的词典文件夹下就行了

32
飞天玄舞6 在职认证  发表于 2016-4-29 23:57:39
hbwzhsh 发表于 2014-4-4 23:06
不错啊
请问路径是怎么设置的

33
守望流年 发表于 2016-5-11 15:06:47
请问,为什么安装字典的时候总提示:没有"installDict"这个函数  ???

34
南极冰川 发表于 2016-8-15 14:51:22
松子茶hc 发表于 2015-10-29 10:23
我也遇到了和楼上同样的问题,自己装在的txt词典没有对分词起到作用,而且是已经安装成功了,请问是什么原因 ...
那是因为你的分词表中有虚词,只要有虚词,即使你添加了分词表也会在虚词的地方断开,

35
松子茶hc 发表于 2016-8-16 14:10:28
南极冰川 发表于 2016-8-15 14:51
那是因为你的分词表中有虚词,只要有虚词,即使你添加了分词表也会在虚词的地方断开,
原来是这样,我再重新试试,谢谢

36
yi_qiaoan 发表于 2016-9-7 09:08:26
我转换了txt的编码还是不行,报错:无法打开链结。但是,可以直接将自定义词库的后缀名改为.dic,然后放入Rwordseg文件夹下的config文件夹即可。碰到同样问题的可以试试这个方法。

37
yangming98 发表于 2016-9-7 22:47:37 来自手机
朽木七根 发表于 2014-3-28 00:44
我有这样一列的数据,R语言中Rwordseg包分不出来,我如何自定词库(淘宝,....)对这列文本进行规范,哪位大 ...
需要将默认的词库删除

38
韫檬祈 发表于 2017-3-23 10:30:18
jiangbeilu 发表于 2015-10-29 21:50
我知道是什么原因了,是因为在windows下,你用txt文件,默认的是ansi格式的数据。

你只需要把编码变成 ...
为什么我转了编码可是还是不起作用,求助

39
怎么没来盗号! 在职认证  发表于 2020-4-22 16:00:47
jiangbeilu 发表于 2015-11-18 15:14
自定义词库我是用的 :insertWords( )
删除可以用:deleteWords( )
这两个都是临时的,你可以试一下。
...
报错:could not find function "insertWords"
怎么办啊????

40
怎么没来盗号! 在职认证  发表于 2020-4-22 16:00:54
jiangbeilu 发表于 2015-11-18 15:14
自定义词库我是用的 :insertWords( )
删除可以用:deleteWords( )
这两个都是临时的,你可以试一下。
...
报错:could not find function "insertWords"
怎么办啊????

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-25 00:02