人大经济论坛 › 论坛 › 数据科学与人工智能 › 人工智能 › 自然语言处理 › 情感分析的时候老是报度量数目不对是什么原因？

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

发帖

楼主: 白痴小姐

1302 1

情感分析的时候老是报度量数目不对是什么原因？ [推广有奖]

0关注
0粉丝

小学生

85%

还不是VIP/贵宾

威望: 0 级
论坛币: 0 个
通用积分: 0.0042
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 55 点
帖子: 6
精华: 0
在线时间: 13 小时
注册时间: 2016-8-6
最后登录: 2017-7-16

楼主

白痴小姐 发表于 2017-5-1 11:41:55 |只看作者 |坛友微信交流群|倒序 |AI写论文

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

情感分析清洗数据的时候，有好几处报度量数目不对，小白一个，之前也没有学过R，请教各位大神，到底是什么原因

> train<- read.csv("C:\\Users\\Administrator\\Desktop\\新建文件夹\\1.csv",quote = "",sep = "\"", header = F,col.names = 'msg', stringsAsFactors = F)
> neg <- read.csv("C:\\Users\\Administrator\\Desktop\\新建文件夹\\neg.csv", header = F, sep = ",", stringsAsFactors = F)
> weight <- rep(-1, length(neg[,1]))
> neg <- cbind(neg, weight)
> pos <- read.csv("C:\\Users\\Administrator\\Desktop\\新建文件夹\\pos.csv", header = F, sep = ",", stringsAsFactors = F)
> weight <- rep(1, length(pos[,1]))
> pos <- cbind(pos, weight)
> posneg <- rbind(pos, neg)
> names(posneg) <- c("term", "weight")
> posneg <- posneg[!duplicated(posneg$term), ]
> dict <- posneg[, "term"]
> library(Rwordseg)
> sentence <- as.vector(train$msg)
> sentence <- gsub("[[:digit:]]*", "", sentence)
> sentence <- gsub("[a-zA-Z]", "", sentence)
> sentence <- gsub("\\.", "", sentence)
> train<- train[!is.na(sentence), ]
> sentence <- sentence[!is.na(sentence)]

>train <- train[!nchar(sentence) < 2, ] #老师这里说量度数目不对，我实在找不到问题是怎么回事了
>sentence <- sentence[!nchar(sentence) < 2]
>system.time(x <- segmentCN(strwords = sentence))
> temp <- lapply(x, length)
> temp <- unlist(temp)
> id <- rep(train[, "id"], temp) #这里也说量度数目不对
> label <- rep(train[, "label"], temp) #这里也是说量度数目不对
> term <- unlist(x)
> testterm <- as.data.frame(cbind(id, term, label), stringsAsFactors = F)
>stopword <- read.csv("C:\\Users\\Administrator\\Desktop\\新建文件夹\\stopword.csv", header = F, sep = ",", stringsAsFactors = F)
> stopword <- stopword[!stopword$term %in% posneg$term,]
> testterm <- testterm[!testterm$term %in% stopword,]

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：是什么原因情感分析 Train rain 情感

情感分析的时候老是报度量数目不对是什么原因？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

本版微信群

情感分析的时候老是报度量数目不对是什么原因？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本版微信群

扫码加我拉你入群