楼主: wyfhdl
18666 33

[问答] Rwordseg使用不成功,求指导 [推广有奖]

  • 5关注
  • 15粉丝

已卖:1502份资源

副教授

26%

还不是VIP/贵宾

-

威望
0
论坛币
2526 个
通用积分
138.3977
学术水平
27 点
热心指数
33 点
信用等级
23 点
经验
60603 点
帖子
260
精华
0
在线时间
1248 小时
注册时间
2009-12-21
最后登录
2023-2-21

楼主
wyfhdl 发表于 2013-2-16 23:51:00 |AI写论文
10论坛币
用Rweibo,对关注的网站进行了抓取,内容放入附件res.txt中,
使用Rwordseg进行分词,分词结果是对所有的字进行了拆分,代码如下:

res2<-as.character(res)
words1=unlist(lapply(X=res2,FUN=segmentCN))
word.result=lapply(X=words,FUN=strsplit,"")
v=table(unlist(word.result))
v1=sort(v,deceasing=T)
head(v1[1:100])
d=data.frame(word=names(v1),freq=v1 )

关键词:words word SEG RDS 求指导 求助 names
犯我华者 虽远必诛

沙发
wyfhdl 发表于 2013-2-17 02:13:53
最终还是解决了,主要原因是在使用strsplit的时候把原本已经划分好的词再次进行了拆分;代码如下
insertWords(c("专家滋询汇","多美滋","挺好的"))
res<-read.table("D:\\Documents\\res1.txt",header=T,stringsAsFactors=F)
res1<-as.character(res)
x2<-list(res1)
words<-segmentCN(unlist(x2))
str(words)
v1=sort(v,deceasing=T)
Dfrm<-data.frame(word=names(v1),freq=v1)
已有 1 人评分学术水平 热心指数 收起 理由
耕耘使者 + 1 + 1 观点有启发

总评分: 学术水平 + 1  热心指数 + 1   查看全部评分

犯我华者 虽远必诛

藤椅
xunxunyulove 发表于 2013-4-18 23:43:50
wyfhdl 发表于 2013-2-17 02:13
最终还是解决了,主要原因是在使用strsplit的时候把原本已经划分好的词再次进行了拆分;代码如下
insertWo ...
为什么我这个Rwordseg包下载总出错呢?
Rweibo抓取之后想分词 但是这个总是出错,求解

板凳
wyfhdl 发表于 2013-4-19 11:15:16
xunxunyulove 发表于 2013-4-18 23:43
为什么我这个Rwordseg包下载总出错呢?
Rweibo抓取之后想分词 但是这个总是出错,求解
在上面菜单栏里面的程序包->R-Forge 然后install.packages("...")
或者直接在CRAN里面 下载win版本的ZIP包
已有 1 人评分热心指数 收起 理由
耕耘使者 + 1 热心帮助其他会员

总评分: 热心指数 + 1   查看全部评分

犯我华者 虽远必诛

报纸
xunxunyulove 发表于 2013-4-20 20:54:10
wyfhdl 发表于 2013-4-19 11:15
在上面菜单栏里面的程序包->R-Forge 然后install.packages("...")
或者直接在CRAN里面 下载win版本的ZIP ...
谢谢,我这几天下载成功了 正在尝试怎么做分词,好难啊

地板
wyfhdl 发表于 2013-4-20 22:34:38
xunxunyulove 发表于 2013-4-20 20:54
谢谢,我这几天下载成功了 正在尝试怎么做分词,好难啊
。。。估计你是对数据类型比较晕吧,多用mode() 看看你数据结构,一般都是通过外源导入,还有就是你在用read.table的时候注意下
犯我华者 虽远必诛

7
kuku816 发表于 2013-4-30 16:45:34
:(((

8
shang00122 在职认证  发表于 2013-6-2 21:47:52
我也是无法安装
install.packages("Rwordseg", repos = "http://R-Forge.R-project.org")

   package ‘Rwordseg’ is available as a source package but not as a binary

Warning message:
package ‘Rwordseg’ is not available (for R version 3.0.1)

9
wyfhdl 发表于 2013-6-3 09:13:56
shang00122 发表于 2013-6-2 21:47
我也是无法安装
install.packages("Rwordseg", repos = "http://R-Forge.R-project.org")
是这样。。。jian哥的package 最好直接去jian哥的blog 上去安装,在R-forge 上经常会遇到各种坑爹问题
已有 1 人评分热心指数 收起 理由
耕耘使者 + 1 热心帮助其他会员

总评分: 热心指数 + 1   查看全部评分

犯我华者 虽远必诛

10
smartalex 在职认证  发表于 2013-9-15 11:10:51
楼主,你好,为什么我用Rweibo包搜索关键词之后得到的数据,放进txt文件之后,使用read.table函数时出现“列的数据比列的名字要多”。是不是在存进txt文件时要对搜索的数据做什么修改?
已有 1 人评分热心指数 收起 理由
耕耘使者 + 1 鼓励学术交流

总评分: 热心指数 + 1   查看全部评分

华工经贸版块申请链接https://bbs.pinggu.org/z_gaoxiao.php?action=add&gid=2116,加油了!!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 13:18