楼主: shushu0629
4279 4

[问答] 统计词频出了问题,望大神帮忙 [推广有奖]

  • 0关注
  • 0粉丝

大专生

16%

还不是VIP/贵宾

-

威望
0
论坛币
139 个
通用积分
0.1200
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
201 点
帖子
22
精华
0
在线时间
58 小时
注册时间
2016-3-8
最后登录
2023-7-20

27论坛币
利用jiebaR切词,然后想统计词频出了问题,下面是代码:

library(jiebaR)
seg=qseg <= "F://jiebar.txt"
seg=seg[nchar(seg)>1]
seg=table(seg)

seg=seg[!grep('[0-9]+',names(seg))]
length(seg)

结果是为0  没有结果

又改了下代码,
f <- scan('F://jiebar.txt',sep='\n',what='',encoding="UTF-8")
seg <- qseg[f] #使用qseg类型分词,并把结果保存到对象seg中
到了这一步就出错了

Error in file.exists(code) : 转换文件名时出了问题--名字太长了?


望帮助,帮改或教我如何正确统计词频,谢谢
附件: jiebar.txt (5.19 MB)

关键词:Library jiebaR length Names BRARY 统计
沙发
baoyuzeng 发表于 2016-10-12 09:49:40 |只看作者 |坛友微信交流群
此帖仅作者可见

使用道具

藤椅
baoyuzeng 发表于 2016-10-12 09:52:25 |只看作者 |坛友微信交流群
此帖仅作者可见

使用道具

板凳
shushu0629 发表于 2016-10-12 20:00:35 |只看作者 |坛友微信交流群
此帖仅作者可见

使用道具

报纸
qishi821 发表于 2017-3-31 10:59:42 |只看作者 |坛友微信交流群
此帖仅作者可见

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-6 05:00