楼主: hayixiao
5139 18

[实际应用] 请教用corpus处理分词语料库的一个问题 [推广有奖]

11
hayixiao 发表于 2017-6-19 00:55:42 |只看作者 |坛友微信交流群
jiangbeilu 发表于 2017-6-18 19:59
我用的一个文件试了一下,是可以正常的,只是inspect无法显示出文本内容。因为现在用了64位的R,而电脑里 ...
可能是R版本的问题,请教大侠的R版本是哪种?我用的R x64 3.4.0。Java的版本以前是64位
的,经大侠提醒后我重新更新了最新版的Java,也删除了旧版的。情况还是一样的。用inspect
可以显示文本内容。
> temp<-Corpus(VectorSource(bingqi),readerControl = list(reader = reader(VectorSource(bingqi)),language = 'cn'))
> inspect(temp)
<<SimpleCorpus>>
Metadata:  corpus specific: 1, document level (indexed): 0
Content:  documents: 5
[1] c("企业社会责任报告", "有", "抱负", "负", "责任", "受", "尊重", "智力", "窆", "设", "中国", "色", "的", "尤", "迷", "兵", "工业", "豸", "实", "多", "见", "中国梦", "择", "罕", "梦", "散", "出", "和", "秣"……)
[2] c("内容", "选择", "结合", "兵器工业集团", "产业", "特点", "和", "发展", "实际", "通过", "以下", "方法", "确定",……)
[3] ……
……

即第30行代码之前和视频中的是完全一样的。执行完第30行代码后就不一致了。也不知怎么解决。
还请赐教。

使用道具

12
hayixiao 发表于 2017-6-19 00:57:15 |只看作者 |坛友微信交流群
>temp<-Corpus(VectorSource(bingqi),readerControl = list(reader = readPlain,language = 'cn'))
用此语句,结果一样!

使用道具

13
hayixiao 发表于 2017-6-19 01:09:21 |只看作者 |坛友微信交流群
jiangbeilu 发表于 2017-6-18 19:59
我用的一个文件试了一下,是可以正常的,只是inspect无法显示出文本内容。因为现在用了64位的R,而电脑里 ...
首先感谢版主的热情回答。其次,还请版主帮忙解决。第三,版主验证代码的结果和我的是一样的吗?还是和视频中的结果一样?

使用道具

14
hayixiao 发表于 2017-6-19 15:22:08 |只看作者 |坛友微信交流群
jiangbeilu 发表于 2017-6-19 14:19
我觉得 很可以是R的版本问题,像Rwordseg包好像不是cran上了,视频中的R版本跟现在已经相差了两年吧,2年 ...
版主用于验证的R版本号是多少啊?你的验证结果和我的一样吗?还是和视频教程中的一样?

使用道具

15
jiangbeilu 学生认证  发表于 2017-6-19 17:45:15 |只看作者 |坛友微信交流群
hayixiao 发表于 2017-6-19 15:22
版主用于验证的R版本号是多少啊?你的验证结果和我的一样吗?还是和视频教程中的一样?
3.3.1的版本

使用道具

16
hayixiao 发表于 2017-6-20 09:10:54 |只看作者 |坛友微信交流群
确实是R版本的问题,我用R3.0.2版本就可以完全验证视频。谢谢!

使用道具

17
hayixiao 发表于 2017-6-20 09:12:46 |只看作者 |坛友微信交流群
金币怎么给你呢?

使用道具

18
hayixiao 发表于 2017-6-20 09:13:08 |只看作者 |坛友微信交流群
jiangbeilu 发表于 2017-6-19 17:45
3.3.1的版本
金币怎么给你呢?

使用道具

19
hayixiao 发表于 2017-6-20 09:13:12 |只看作者 |坛友微信交流群
jiangbeilu 发表于 2017-6-19 17:45
3.3.1的版本
金币怎么给你呢?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-17 23:44