楼主: 聂大仙
3960 0

[问答] R语言中的英文分词问题 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

学前班

80%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
30 点
帖子
1
精华
0
在线时间
4 小时
注册时间
2016-4-26
最后登录
2016-5-18

楼主
聂大仙 发表于 2016-5-10 10:26:04 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
library(tm)
library(NLP)
library(twitteR)
for (i in 11:15) { cat(paste("[[", i, "]] ", sep=""))+ writeLines(strwrap(rdmTweets[]$getText(), width=73))}
df=do.call("rbind",lapply(rdmTweets,as.data.frame))
dim(df)
library(tm)
myCorpus=Corpus(VectorSource(df$text))
myCorpus
myCorpus=tm_map(myCorpus,tolower)
myCorpus=tm_map(myCorpus,removePunctuation)
myCorpus=tm_map(myCorpus,removeNumbers)
removeURL <- function(x) gsub("http[[:alnum:]]*", "", x)
myCorpus <- tm_map(myCorpus, removeURL)
myStopwords <- c(stopwords('english'), "available", "via")
myStopwords <- setdiff(myStopwords, c("r", "big"))
myCorpus=tm_map(myCorpus,removeWords,myStopwords)
myCorpus[1]
myCorpusCopy=myCorpus
library(SnowballC)
library(RWeka)
myCorpus<-tm_map(myCorpus,stemDocument)
for (i in 11:15) { cat(paste("[[", i, "]] ", sep="")) +writeLines(strwrap(myCorpus[], width=73))}
myCorpus <- tm_map(myCorpus, stemCompletion, dictionary=myCorpusCopy)
myDtm = DocumentTermMatrix(myCorpus, control = list(minWordLength = 3))

Error: inherits(doc, "TextDocument") is not TRUE
进行到英文词向量矩阵的时候,报错如下,求各位大神指教一下,感激不尽!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:R语言 punctuation Library Numbers twitter R语言

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-20 11:32