用tm做文本分析,想要剔除中文的停用词
在网上找了一个哈工大的停用词表
然后保存为一个名为stopwordsCN的文本向量
但是用tm_map(X, removeWords,stopwordsCN)却提示出错了,“错误于gsub(sprintf("(*UCP)\\b(%s)\\b", paste(words, collapse = "|"))”
求解决方法
|
楼主: lightcatcher
|
18632
10
[问答] 文本分析(tm)怎么导入中文停用词? |
|
高中生 22%
-
|
| ||
|
|
| ||
| ||
| ||||||||
| ||
| ||
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


