楼主: |Devil灬
1619 1

[问答] 建立模型后,如何将新文本加入进去经行测试 [推广有奖]

  • 0关注
  • 1粉丝

初中生

57%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
82 点
帖子
8
精华
0
在线时间
16 小时
注册时间
2015-5-9
最后登录
2016-4-9

楼主
|Devil灬 发表于 2015-8-30 16:02:27 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
这个是主题模型建立:
library(slam)
summary(col_sums(sample.dtm))
term_tfidf <- tapply(sample.dtm$v/row_sums( sample.dtm)[ sample.dtm$i],
                     sample.dtm$j, mean)*
  log2(nDocs( sample.dtm)/col_sums( sample.dtm > 0))
summary(term_tfidf)
sample.dtm <- sample.dtm[, term_tfidf >= 0.1]
sample.dtm <- sample.dtm[row_sums(sample.dtm) > 0,]
k <- length(unique(csv$type))
library(topicmodels)
SEED <- 2012
sample_TM <- list(
  VEM = LDA( sample.dtm, k=k, control = list(seed = SEED)),
  VEM_fixed = LDA( sample.dtm, k = k, control = list(estimate.alpha = FALSE, seed = SEED)),
  Gibbs = LDA( sample.dtm, k = k, method = "Gibbs", control = list(seed = SEED, burnin =
                                                                      1000, thin = 100, iter = 1000)),
  CTM = CTM( sample.dtm, k = k, control = list(seed = SEED, var = list(tol = 10^-4), em =
                                                  list(tol = 10^-3))))
sapply(sample_TM[1:2], slot, "alpha")
sapply(sample_TM, function(x) mean(apply(posterior(x)$topics,1, function(z)
  -sum(z*log(z)))))
Topic <- topics(sample_TM[["VEM"]], 1)
Terms <- terms(sample_TM[["VEM"]], 5)
Terms[, 1:6]
这一部分完了后是否就可以拿新文本进行测试了?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:建立模型 Summary Library Sample Summa 模型 如何

沙发
hayixiao 发表于 2017-9-24 20:22:38
问题解决了吗?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 03:50