楼主: 用户名是啥
6377 3

[问答] R语言进行中文文本挖掘出现乱码 [推广有奖]

  • 15关注
  • 0粉丝

已卖:2份资源

硕士生

5%

还不是VIP/贵宾

-

威望
0
论坛币
42 个
通用积分
9.4250
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
615 点
帖子
26
精华
0
在线时间
249 小时
注册时间
2015-4-6
最后登录
2025-12-30

楼主
用户名是啥 发表于 2015-5-9 20:57:44 |AI写论文
30论坛币

紧急求助:要对一系列文件进行中文文本挖掘,文件有1000多个,目前有txt格式和html格式的,现在想要做出tdm词条文档矩阵,代码该咋写??现在仅是做了这一步(如图),就已经出现中文乱码了,原谅我是编程小白,求大神们帮忙。本人邮箱kezhenw001@163.com QQ图片20150509204420.png

caseshare-txt版本.zip
下载链接: https://bbs.pinggu.org/a-1788862.html

7.59 MB

需要: 10 个论坛币  [购买]

关键词:文本挖掘 R语言 txt格式 紧急求助 HTML 中文 文本挖掘

沙发
用户名是啥(未真实交易用户) 发表于 2015-6-9 09:59:32
搞定了

藤椅
smile108(未真实交易用户) 发表于 2015-8-5 08:50:08
用户名是啥 发表于 2015-6-9 09:59
搞定了
请问楼主怎么搞定的呢?分享下心得咯。我在用这个的时候也出现了一个小问题。nec nos aëriae voce中间这个aeriae显示错误……
还望楼主指导
代码:txt <- system.file("texts","txt",package = "tm")
writeLines(as.character(ovid[[2]]))

BAHKKV19Y$(A}M2G@G13JOD.png (1.61 KB)

BAHKKV19Y$(A}M2G@G13JOD.png

板凳
bk3333(未真实交易用户) 发表于 2018-2-6 09:57:25
将R和Rstudio升级到最新版本,完美解决问题。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-7 20:21