楼主: 角尖
1816 2

请教一个文本挖掘tm包的问题 [推广有奖]

  • 1关注
  • 2粉丝

博士生

87%

还不是VIP/贵宾

-

威望
0
论坛币
7 个
通用积分
36.4494
学术水平
3 点
热心指数
3 点
信用等级
2 点
经验
3154 点
帖子
199
精华
0
在线时间
347 小时
注册时间
2008-6-10
最后登录
2025-1-6

楼主
角尖 发表于 2015-9-1 22:26:01 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
网上有一个《中文及英文的文本挖掘——R语言》的帖子。http://wenku.baidu.com/link?url=g5aw3voxuHC0QTza_KgHh05nQ_JPbo2g2BxuPtQOKQzy31KbgK6O-QLaItK7U1rCBSmWiYwXyb6rz3ViolH3BNgNzKW_U-A6Naa8sDvGGGe
其中有一段代码是
reut<-system.file("texts","crude",package='tm') # 用Corpus命令读取文本并生成语料库文件由于要读取的是xml文件,所以需要xml包reuters <- Corpus(DirSource(reut), readerControl = list(reader = readReut21578XML))
然后作者说,用inspect(reuters[1:2]),可以看到 inspect.png
为什么我用这个inspect(reuters[1:2]),看到的是下面这个呢?
<<VCorpus>>Metadata:  corpus specific: 0, document level (indexed): 0Content:  documents: 2[[1]]<<XMLTextDocument>>Metadata:  16[[2]]<<XMLTextDocument>>Metadata:  16

求指教,什么原因?


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:文本挖掘 wenku baidu link HTTP 英文 中文

沙发
visuallion 发表于 2016-3-15 00:11:15
reuters[[1]]

藤椅
wangtan724 发表于 2016-9-25 15:29:06
请问找到答案了没???求指教

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-21 16:22