楼主: 羊乖乖
8054 6

[问答] 用R进行分词到转向量的时候总是出错是怎么回事? [推广有奖]

  • 1关注
  • 1粉丝

已卖:1份资源

本科生

38%

还不是VIP/贵宾

-

威望
0
论坛币
189 个
通用积分
2.7900
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
5462 点
帖子
48
精华
0
在线时间
96 小时
注册时间
2015-8-24
最后登录
2020-9-28

楼主
羊乖乖 发表于 2016-1-7 10:50:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
用R语言进行分词,文本文档在转向量的时候总是出现错误:


此外: Warning message:
In strsplit(msg, "\n") : 输入的字符串1不适用于此语言环境


将文本文档改为UTF-8的格式运行还是会出现提示:

Error in file.exists(strwords) : 转换文件名时出了问题--名字太长了?


代码如下:
library(rJava)
library(Rwordseg)
library(RColorBrewer)
library(wordcloud)

myfile=read.csv('myyun.txt',header=F)
myfile.res=myfile[myfile!=""]
myfile.words=unlist(lapply(X=myfile.res,FUN=segmentCN))

此外: Warning message:
In strsplit(msg, "\n") : 输入的字符串1不适用于此语言环境
> myfile=read.csv('myyun0.txt',header=F)
> myfile.res=myfile[myfile!=""]
> myfile.words=unlist(lapply(X=myfile.res,FUN=segmentCN))
Error in file.exists(strwords) : 转换文件名时出了问题--名字太长了?



请教一下各位高手 这是怎么回事?要如何解决?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:segmentCN Library warning Message segment message library 字符串 Error

沙发
jiangbeilu 学生认证  发表于 2016-1-7 15:40:51
上传文本文档试一下

藤椅
守望流年 发表于 2016-4-29 14:30:18
同求呀

板凳
sabin 发表于 2016-5-3 17:54:36
真是奇怪,最近都遇到这个问题

报纸
sabin 发表于 2016-5-3 17:54:59
明明之前是可用的,难道网站做了更新?

地板
cs3520 发表于 2018-1-6 11:28:02
解决了吗?

7
myjconan 发表于 2018-7-4 15:33:17
把你要处理的文本用记事本另存一下格式选ANSI试试?如果是UTF-8好像不行,另外自定义词库要UTF-8格式的,两个好像不一样
已有 1 人评分论坛币 收起 理由
admin_kefu + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-21 21:38