楼主: pipi1993
2068 0

[问答] 【紧急】有关quanteda包的乱码 [推广有奖]

  • 0关注
  • 0粉丝

初中生

66%

还不是VIP/贵宾

-

威望
0
论坛币
3 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
353 点
帖子
7
精华
0
在线时间
13 小时
注册时间
2018-6-17
最后登录
2019-3-28

楼主
pipi1993 发表于 2018-7-1 20:30:53 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
构造DFT之后是乱码,关键是它时而正确时而乱码,不知道什么原因啊,有没有大神指点一二,万分感谢
-------------------------------------------------------------------------------------------------------------------------------------
data_stw<-readLines("stop.txt",encoding="UTF-8")
library(quanteda)
my_corpus <- corpus(reuters)
docvars(my_corpus, "language") <- "zh_CN"
metadoc(my_corpus, "language") <- "zh_CN"
myDfm <- dfm(my_corpus, what = c("fastestword"),remove =data_stw, stem = F, remove_punct = F) # 文档词频矩阵
topfeatures(myDfm,20)  # 20 词频最高的词

Warning message:
In strsplit(code, "\n", fixed = TRUE) :
  input string 1 is invalid in this locale
钀ヤ笟鍘\x85  浜哄憳杩濊       鎶曡瘔       涓氬姟       鍛婄煡       鍔炵悊       鐢ㄦ埛       鍙楃悊       鐢佃垂
         430          186          182          181          179          139          109          103           89
      鏈\xaa       缂磋垂       涓嶆弧       鐢靛崱 闈炲父涓嶆弧       鎴峰彿        瀵规       鐢佃瘽        绛斿
          88           84           84           80           64           59           57           56           53
      鐢佃〃  杩濊琛屼负
          48           46


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:有没有

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-4 18:24