楼主: 大懒宇
7324 8

[问答] 一下把很多中文文本进行分词的R程序,并能够计算出文档词频矩阵的R程序 [推广有奖]

  • 1关注
  • 0粉丝

已卖:11份资源

高中生

40%

还不是VIP/贵宾

-

威望
0
论坛币
35 个
通用积分
0.0600
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
982 点
帖子
17
精华
0
在线时间
35 小时
注册时间
2012-8-22
最后登录
2017-5-18

楼主
大懒宇 发表于 2015-3-25 13:53:37 |AI写论文
2论坛币

最佳答案

ryoeng 查看完整内容

http://rpubs.com/englianhu/MilestoneReport 中文的话,使用以下程序包。 http://jliblog.com/app/tmcn
关键词:R程序 中文 程序

回帖推荐

ryoeng 发表于2楼  查看完整内容

http://rpubs.com/englianhu/MilestoneReport 中文的话,使用以下程序包。 http://jliblog.com/app/tmcn

沙发
ryoeng 在职认证  发表于 2015-3-25 13:53:38
提示: 作者被禁止或删除 内容自动屏蔽

藤椅
nuomin 发表于 2015-3-26 20:02:23
R语言做中文处理能力弱,不能好好支持GBK编码

板凳
ryoeng 在职认证  发表于 2015-3-26 21:17:18
提示: 作者被禁止或删除 内容自动屏蔽

报纸
大懒宇 发表于 2015-3-27 09:05:56
ryoeng 发表于 2015-3-26 21:17
http://jliblog.com/app/tmcn
这个只能一次分一篇文章,能不能做一个循环,可以一下分很多篇文章,还有计算文档词频矩阵的代码,急求!

地板
ryoeng 在职认证  发表于 2015-3-29 17:28:06
提示: 作者被禁止或删除 内容自动屏蔽

7
tosogo2 发表于 2016-10-7 16:29:43
问一下楼主的问题解决了吗?
我要分析大约200篇txt文件的词频。

8
紫蕊 发表于 2016-11-29 17:03:30
tosogo2 发表于 2016-10-7 16:29
问一下楼主的问题解决了吗?
我要分析大约200篇txt文件的词频。
你好,后面你又找到这个的解决办法吗?求助

9
大懒宇 发表于 2016-12-6 20:56:52
tosogo2 发表于 2016-10-7 16:29
问一下楼主的问题解决了吗?
我要分析大约200篇txt文件的词频。
sample.words <- lapply(csv$text, removeNumbers)
wordsegment<- function(x) {
    library(Rwordseg)
segmentCN(x)
}
sample.words <- lapply(sample.words, wordsegment)
当时用的Rwordseg包做的,你搜搜看好像有个专门写这个的博客

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 02:41