楼主: pennyr617
7222 8

[实际应用] 求文本挖掘中文停用词txt [推广有奖]

  • 0关注
  • 0粉丝

本科生

98%

还不是VIP/贵宾

-

威望
0
论坛币
841 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
837 点
帖子
51
精华
0
在线时间
143 小时
注册时间
2012-3-31
最后登录
2023-12-4

楼主
pennyr617 发表于 2019-1-8 16:14:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位大神,谁有中文分词停用词txt文件,可以分享一下吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:文本挖掘 txt 中文分词 分享一下

沙发
Boy_next_door 发表于 2019-1-8 16:40:13
dat格式的

stopwords.rar
下载链接: https://bbs.pinggu.org/a-2704124.html

5.59 KB

需要: 10 个论坛币  [购买]

中文停用词

本附件包括:

  • stopwords.dat

已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
admin_kefu + 20 + 2 + 2 + 2 热心帮助其他会员

总评分: 论坛币 + 20  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

藤椅
fyc7346165 发表于 2019-1-8 17:26:35
https://github.com/goto456/stopwords
目前网上能得到的最流行的几个停用词表在这都能下载,但是说实话没有一个是能直接拿来用的
英文有一个普遍认同的通用停用词表,但是在中文中目前貌似没有一个适合所有研究的停用词表
如果只是做个词云看一看之类的这个就够用,但是比较细节的研究还是建议把这些作为参考构建自己的停用词表比较好
已有 1 人评分论坛币 收起 理由
admin_kefu + 20 热心帮助其他会员

总评分: 论坛币 + 20   查看全部评分

板凳
pennyr617 发表于 2019-1-9 09:37:38
谢谢楼上,我之前没有登过github网站,请问刚才分享的停用词表怎么下载到本地电脑呢?
github停用词表.png

报纸
fyc7346165 发表于 2019-1-10 19:25:28
pennyr617 发表于 2019-1-9 09:37
谢谢楼上,我之前没有登过github网站,请问刚才分享的停用词表怎么下载到本地电脑呢?
在最外面点那个绿色的clone or download,然后选择download ZIP

地板
pennyr617 发表于 2019-1-14 10:18:02
谢谢楼上,我已经下载停用词成功,但在导入R过程中遇到问题,请问该如何解决?具体导入代码和导入文本截图如下所示:
stopwords<- read.table("D:/R-learning/中文停用词表.txt",stringsAsFactors = FALSE,encoding = "UTF-8",sep = "\n")
导入停用词表问题.png

7
sky呵呵呵呵123 发表于 2019-1-31 17:04:21
fyc7346165 发表于 2019-1-8 17:26
https://github.com/goto456/stopwords
目前网上能得到的最流行的几个停用词表在这都能下载,但是说实话没 ...
感谢分享,正好要用~~~~

8
paq5612781 发表于 2019-5-13 16:21:38
谢谢分享

9
sunhanhan1996 学生认证  发表于 2021-12-12 10:58:39
感谢分享,刚好要用

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-17 18:17