请选择 进入手机版 | 继续访问电脑版
楼主: 松子茶hc
10753 13

[问答] Rwordseg中文停用词导入成功但没有删除 [推广有奖]

hayixiao 发表于 2017-4-27 11:42:24 |显示全部楼层 |坛友微信交流群
gtssp 发表于 2017-2-16 14:53
我也碰到这个情况,检查了一下,发现是stopword的txt文件里每个停止词后面都有一个空格,导致读出的stopw ...
能提供用gsub删除空格的代码吗?

使用道具

yangming98 发表于 2017-4-28 22:51:37 来自手机 |显示全部楼层 |坛友微信交流群
松子茶hc 发表于 2015-11-3 16:34
请问用Rwordseg分词的时候,导入的中文停用词,是txt格式,导入成功没有错误,但是实际结果中停用词并没有被 ...
好的好的

使用道具

gtssp 发表于 2017-5-18 21:36:49 |显示全部楼层 |坛友微信交流群
hayixiao 发表于 2017-4-27 11:42
能提供用gsub删除空格的代码吗?
#f <- readLines("./stoplist.txt")
#删除空格
#f <- gsub(" ","",f)

使用道具

hayixiao 发表于 2017-5-31 10:09:35 |显示全部楼层 |坛友微信交流群
gtssp 发表于 2017-5-18 21:36
#f
非常感谢!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-28 16:10