楼主: yuanhangzhe
17218 30

[问答] R语言中文分词请教 [推广有奖]

11
yuanhangzhe 发表于 2015-8-15 09:30:26
chengyn 发表于 2015-3-16 15:13
那这个包在哪下?给个链接可以吗
官网有

12
yuanhangzhe 发表于 2015-8-15 09:32:46
用户名是啥 发表于 2015-5-4 22:25
你好 我看到刘思喆的文章中中文分词是这么写的
library(Rwordseg)
> segmentCN(' 花儿为什么这样红')
看下tm包的教程,那里面有

13
torrentpien 学生认证  发表于 2015-8-15 10:49:38
楼主您说可以用jieba,我用jieba也遇到同样的问题,也是要tm降版吗?

14
yuanhangzhe 发表于 2015-8-16 10:16:40
torrentpien 发表于 2015-8-15 10:49
楼主您说可以用jieba,我用jieba也遇到同样的问题,也是要tm降版吗?
什么问题?

15
torrentpien 学生认证  发表于 2015-8-16 11:17:26
yuanhangzhe 发表于 2015-8-16 10:16
什么问题?
我用jieba及tm 0.62,也出现分词有\n的情形,楼主把tm转成0.58后有改善吗?

16
yuanhangzhe 发表于 2015-8-17 21:50:13
torrentpien 发表于 2015-8-16 11:17
我用jieba及tm 0.62,也出现分词有\n的情形,楼主把tm转成0.58后有改善吗?
分词不会出现吧,是dtm中出现\n

17
yuanhangzhe 发表于 2015-8-17 21:50:14
torrentpien 发表于 2015-8-16 11:17
我用jieba及tm 0.62,也出现分词有\n的情形,楼主把tm转成0.58后有改善吗?
分词不会出现吧,是dtm中出现\n

18
兜兜爱人大 发表于 2015-11-9 10:20:17
请问一下,分词后 文本矩阵怎么形成?就是分词后词变为一个向量的元素?

19
zizulvxing 发表于 2015-11-9 11:42:59
yuanhangzhe 发表于 2015-8-17 21:50
分词不会出现吧,是dtm中出现\n
我用jieba ,DTM矩阵中也有出现“\n”,请问现在解决了吗

20
huchangjian_air 发表于 2015-12-6 12:08:34
yuanhangzhe 发表于 2015-8-17 21:50
分词不会出现吧,是dtm中出现\n
我也是出现\n的情况,重新安装tm只有tm_0.5-8.tar.gz,安装的时候报错如下:

install.packages("C:/Users/hchj/Desktop/tm_0.5-8.tar.gz", repos = NULL, type = "source")
* installing *source* package 'tm' ...
** 成功将'tm'程序包解包并MD5和检查
** libs

*** arch - i386
Warning: 运行命令'make -f "C:/PROGRA~1/R/R-32~1.2/etc/i386/Makeconf" -f "C:/PROGRA~1/R/R-32~1.2/share/make/winshlib.mk" SHLIB="tm.dll" OBJECTS="lazyTmMap.o"'的状态是127
ERROR: compilation failed for package 'tm'
* removing 'C:/Program Files/R/R-3.2.2/library/tm'
Warning in install.packages :
  running command '"C:/PROGRA~1/R/R-32~1.2/bin/x64/R" CMD INSTALL -l "C:\Program Files\R\R-3.2.2\library" "C:/Users/hchj/Desktop/tm_0.5-8.tar.gz"' had status 1
Warning in install.packages :
  installation of package ‘C:/Users/hchj/Desktop/tm_0.5-8.tar.gz’ had non-zero exit status

您当时是怎么解决问题的?期待回复

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 08:31