楼主: 贼公子
11006 14

[问答] Rwordseg分词遇到invalid 'times' argument [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

学前班

60%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
23 点
帖子
2
精华
0
在线时间
1 小时
注册时间
2012-10-13
最后登录
2015-5-25

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
程序如下,
#nature设置 是否输出词性
data.wordseg <- segmentCN(data.all$description, nature = TRUE)
for(i in 1:6000){
  print(i)
  data.wordseg[[i]] <- data.wordseg[[i]][names(data.wordseg[[i]]) %in% c("userDefine","a","ad","an","j","n","nr","ns","nz","v","vd","vn")]
}

报错:
Error in rep(seq_along(X), times = as.numeric(X)) :
  invalid 'times' argument
In addition: Warning messages:
1: In strsplit(strout, split = " ") :
  input string 3 is invalid in this locale
2: In strsplit(strout, split = " ") :
  input string 4 is invalid in this locale
3: In strsplit(strout, split = " ") :
  input string 5 is invalid in this locale
4: In strsplit(strout, split = " ") :
  input string 6 is invalid in this locale
5: In strsplit(strout, split = " ") :
  input string 7 is invalid in this locale

不知道怎么调试了,求助各位

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:argument invalid words Times Valid invalid Rwordseg segmentCN

沙发
ryoeng 在职认证  发表于 2015-5-23 01:31:41 |只看作者 |坛友微信交流群
提示: 作者被禁止或删除 内容自动屏蔽

使用道具

藤椅
贼公子 发表于 2015-5-23 20:37:20 |只看作者 |坛友微信交流群
ryoeng 发表于 2015-5-23 01:31
数据?
data.all <- read.csv(file="1.csv", fileEncoding="GBK")

data.all$description <- paste(data.all$title, data.all$abstract, sep=",")

使用道具

板凳
tyaer 发表于 2015-11-12 17:27:07 |只看作者 |坛友微信交流群
我也遇到这个问题了。

没问题的:

segmentCN("手感很好",nature=T)
segmentCN("系统运行流畅 屏幕大",nature=T)
segmentCN("手感很好a,非常满意",nature=T)

有没问题的:

segmentCN("手感很好性能彪悍",nature=T)
segmentCN("手感很好 性能彪悍",nature=T)

[img][/img]

问题.png (10.87 KB)

问题.png

使用道具

报纸
410645759 发表于 2015-11-23 11:27:54 |只看作者 |坛友微信交流群
请问下,最后有找到解决办法么?如果找到了能分享下面么?

使用道具

地板
yk数据挖掘 发表于 2015-12-4 11:44:39 |只看作者 |坛友微信交流群
tyaer 发表于 2015-11-12 17:27
我也遇到这个问题了。

没问题的:
请问一下,你遇到的这个问题怎么解决的,我也是碰到这个问题了,跟你的一模一样,网上也没有相关的解决方法

使用道具

7
tyaer 发表于 2015-12-25 11:07:16 |只看作者 |坛友微信交流群
最后我终于解决了,是词库的问题,把有奇异分词的词组去掉就OK了

使用道具

8
yk数据挖掘 发表于 2016-1-12 10:29:36 |只看作者 |坛友微信交流群
请问下是怎么解决的,有奇异分词的词组是什么样的?能详细说下吗

使用道具

9
yk数据挖掘 发表于 2016-1-12 10:30:59 |只看作者 |坛友微信交流群
请问怎么解决的?有奇异分词的词组是什么样的?能详细说下吗?

使用道具

10
yk数据挖掘 发表于 2016-1-12 10:32:12 |只看作者 |坛友微信交流群
tyaer 发表于 2015-12-25 11:07
最后我终于解决了,是词库的问题,把有奇异分词的词组去掉就OK了
请问下您是怎么解决的?那个有奇异分组的词组是什么样的?能详细说下吗,我跟您的问题是一样的,一直找不到解决的方法。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 11:35