用R语言对中文文章进行爬虫,之后进行词频处理过程中,得出的文章中出现最多的词往往是“的”,“和”之类的连接词,真实有效的信息被掩盖掉了,请问如何处理这样的问题?谢谢!
|
楼主: teresa_ya
|
3117
5
[问答] 关于R语言分词的疑问 |
|
已卖:1份资源 大专生 65%
-
|
| ||
|
|
| ||
| ||
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


