楼主: 用户名是啥
6013 3

[问答] R语言进行中文文本挖掘出现乱码 [推广有奖]

  • 15关注
  • 0粉丝

硕士生

5%

还不是VIP/贵宾

-

威望
0
论坛币
42 个
通用积分
9.4240
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
615 点
帖子
26
精华
0
在线时间
245 小时
注册时间
2015-4-6
最后登录
2024-3-20

30论坛币

紧急求助:要对一系列文件进行中文文本挖掘,文件有1000多个,目前有txt格式和html格式的,现在想要做出tdm词条文档矩阵,代码该咋写??现在仅是做了这一步(如图),就已经出现中文乱码了,原谅我是编程小白,求大神们帮忙。本人邮箱kezhenw001@163.com QQ图片20150509204420.png

caseshare-txt版本.zip

7.59 MB

需要: 10 个论坛币  [购买]

关键词:文本挖掘 R语言 txt格式 紧急求助 HTML 中文 文本挖掘
搞定了

使用道具

藤椅
smile108 发表于 2015-8-5 08:50:08 |只看作者 |坛友微信交流群
用户名是啥 发表于 2015-6-9 09:59
搞定了
请问楼主怎么搞定的呢?分享下心得咯。我在用这个的时候也出现了一个小问题。nec nos aëriae voce中间这个aeriae显示错误……
还望楼主指导
代码:txt <- system.file("texts","txt",package = "tm")
writeLines(as.character(ovid[[2]]))

BAHKKV19Y$(A}M2G@G13JOD.png (1.61 KB)

BAHKKV19Y$(A}M2G@G13JOD.png

使用道具

板凳
bk3333 发表于 2018-2-6 09:57:25 |只看作者 |坛友微信交流群
将R和Rstudio升级到最新版本,完美解决问题。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 23:37