[问答] 统计词频出了问题，望大神帮忙 [推广有奖]

0关注
0粉丝

大专生

16%

还不是VIP/贵宾

威望: 0 级
论坛币: 139 个
通用积分: 0.1200
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 201 点
帖子: 22
精华: 0
在线时间: 58 小时
注册时间: 2016-3-8
最后登录: 2023-7-20

楼主

shushu0629 发表于 2016-10-11 18:51:52 |AI写论文

27论坛币

利用jiebaR切词，然后想统计词频出了问题，下面是代码：

library(jiebaR)
seg=qseg <= "F://jiebar.txt"
seg=seg[nchar(seg)>1]
seg=table(seg)

seg=seg[!grep('[0-9]+',names(seg))]
length(seg)

结果是为0 没有结果

又改了下代码，
f <- scan('F://jiebar.txt',sep='\n',what='',encoding="UTF-8")
seg <- qseg[f] #使用qseg类型分词，并把结果保存到对象seg中
到了这一步就出错了

Error in file.exists(code) : 转换文件名时出了问题--名字太长了？

望帮助，帮改或教我如何正确统计词频，谢谢
附件：

jiebar.txt (5.19 MB)

分享0 收藏0 回帖

关键词：Library jiebaR length Names BRARY 统计

相关帖子

加关注串个门加好友发消息 1关注 0粉丝大专生 baoyuzeng 当前离线阅读权限 255 威望 0 级论坛币 94 个通用积分 0 学术水平 0 点热心指数 0 点信用等级 0 点经验 3866 点帖子 57 精华 0 在线时间 38 小时注册时间 2016-7-5 最后登录 2016-12-14 雷达卡	沙发 baoyuzeng 发表于 2016-10-12 09:49:40 此帖仅作者可见

	举报

加关注串个门加好友发消息 1关注 0粉丝大专生 baoyuzeng 当前离线阅读权限 255 威望 0 级论坛币 94 个通用积分 0 学术水平 0 点热心指数 0 点信用等级 0 点经验 3866 点帖子 57 精华 0 在线时间 38 小时注册时间 2016-7-5 最后登录 2016-12-14 雷达卡	藤椅 baoyuzeng 发表于 2016-10-12 09:52:25 此帖仅作者可见

	举报

加关注串个门加好友发消息 0关注 0粉丝大专生 shushu0629 当前离线阅读权限 255 威望 0 级论坛币 139 个通用积分 0.1200 学术水平 0 点热心指数 0 点信用等级 0 点经验 201 点帖子 22 精华 0 在线时间 58 小时注册时间 2016-3-8 最后登录 2023-7-20 雷达卡	板凳 shushu0629 发表于 2016-10-12 20:00:35 此帖仅作者可见

	举报

加关注串个门加好友发消息 0关注 0粉丝学前班 qishi821 当前离线阅读权限 255 威望 0 级论坛币 0 个通用积分 0 学术水平 0 点热心指数 0 点信用等级 0 点经验 13 点帖子 1 精华 0 在线时间 0 小时注册时间 2017-3-31 最后登录 2017-3-31 雷达卡	报纸 qishi821 发表于 2017-3-31 10:59:42 此帖仅作者可见

	举报

返回列表

发帖

本版微信群

加好友,备注cda
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[问答] 统计词频出了问题，望大神帮忙 [推广有奖]

相关帖子

浏览过的帖子

浏览过的版块

本版微信群