楼主: 朽木七根
23932 40

[问答] 请问R如何自定词典进行分词 [推广有奖]

  • 5关注
  • 3粉丝

已卖:1份资源

博士生

5%

还不是VIP/贵宾

-

威望
0
论坛币
146 个
通用积分
16.7821
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
11404 点
帖子
268
精华
0
在线时间
161 小时
注册时间
2012-11-18
最后登录
2016-2-26

楼主
朽木七根 发表于 2014-3-28 00:44:48 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
淘宝123
淘宝网
淘宝买的
京东商城
!淘宝的
我有这样一列的数据,R语言中Rwordseg包分不出来,我如何自定词库(淘宝,....)对这列文本进行规范,哪位大哥能指教一下小弟..
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:words word 京东商城 淘宝网 R语言 淘宝商城 淘宝网 淘宝123 词典 如何

沙发
hbwzhsh 发表于 2014-3-28 09:42:28
通过安装自定义词典就行了
installDict(dictpath='E:\\HAO\\大数据分析\\词库\\搜狗词库\\计算机词汇大全【官方推荐】.scel',dictname="计算机",dicttype="scel")

> installDict(dictpath='E:\\HAO\\大数据分析\\词库\\搜狗词库\\计算机词汇大全【官方推荐】.txt',dictname="计算机",dicttype="text")

segmentCN(c("你好北京","今天是个好天气"))
已有 1 人评分论坛币 收起 理由
李会超 + 20 热心帮助其他会员

总评分: 论坛币 + 20   查看全部评分

不懂就要问

藤椅
hbwzhsh 发表于 2014-4-4 23:06:58
不错啊
不懂就要问

板凳
chengyn 发表于 2015-3-16 09:38:25
hbwzhsh 发表于 2014-3-28 09:42
通过安装自定义词典就行了
installDict(dictpath='E:\\HAO\\大数据分析\\词库\\搜狗词库\\计算机词汇大全 ...
错误于installDict("F:\\myword.txt", dictname = "myword", dicttype = "text") :
  Wrong path of the dic file!
为什么会有这种错误,求解

报纸
中西茜 发表于 2015-4-30 11:32:00
我想问一下为什么我installDict之后,4 words were loaded! ... New dictionary '自定义' was installed!但是进行分词的时候我自定义的词组都没有起作用,我是用Rstudio运行的

地板
15619329355 发表于 2015-5-12 18:30:58
拜托有些网友以后回复问题给出的方案是自己测验过得,很多经验贴都是抄别人的,根本不能解决问题

7
15619329355 发表于 2015-5-12 18:44:07
一定要注意,路径的地方是单引号,其余的都是双引号,如果错了,词典就装不上的

8
中西茜 发表于 2015-5-22 09:50:04
15619329355 发表于 2015-5-12 18:44
一定要注意,路径的地方是单引号,其余的都是双引号,如果错了,词典就装不上的
请问一下我是按照路径是单引号,其他都是双引号导入的txt格式的词典,但是分词的时候没有起作用,这个应该怎么解决,我导入scel的词典的时候完全没问题。谢谢了

9
松子茶hc 发表于 2015-10-29 10:23:33
我也遇到了和楼上同样的问题,自己装在的txt词典没有对分词起到作用,而且是已经安装成功了,请问是什么原因呢?改怎么解决呢?谢谢啦~~

10
jiangbeilu 学生认证  发表于 2015-10-29 21:46:44
松子茶hc 发表于 2015-10-29 10:23
我也遇到了和楼上同样的问题,自己装在的txt词典没有对分词起到作用,而且是已经安装成功了,请问是什么原因 ...
同求解答呀

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-24 22:19