我先自己制定了一个分词的词典,然后对需要分词的字段按词典存在的词组进行分词提取,字典不存在的忽略不分词不提取。
例如,我的词典为:(“计算机”,“软件工程”,“中外合作”,“电气类”)
需要分词的字段为: 计算机类(计算机科学与技术、软件工程)(学费:4500元/年)
我想要的分词提取结果为:计算机、软件工程
我知道可以设置停用词过滤不要的,但是我想分词只提取我想要的。因为不要的很杂没办法全部过滤,但是我知道我要的是什么。
请问R语言可以实现吗?如何操作?急求大神赐教


雷达卡


京公网安备 11010802022788号







