楼主: caisinong
1708 1

[问题] 文本挖掘特征选择:该用什么方法? [推广有奖]

  • 1关注
  • 0粉丝

已卖:182份资源

大专生

40%

还不是VIP/贵宾

-

威望
0
论坛币
101 个
通用积分
0.1914
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
316 点
帖子
18
精华
0
在线时间
73 小时
注册时间
2010-10-2
最后登录
2022-10-24

楼主
caisinong 发表于 2016-5-2 22:59:48 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我在尝试用文本挖掘来处理微博信息,在特征选择被卡住了:我试了两种,一种是词频统计后人工筛选前X百个,一种是randomforest的importance项筛选前X百个,发现前者在训练时效果更好。但二者在后面分析新数据时效果都一般,一眼扫过去分类分得乱七八糟。

后来还看到tfidf,但因为我分析微博数据,不知道总文档库该去哪找,感觉无法实行了。

求教大神们都用什么方法来做这个事情呀?十分感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:什么方法 文本挖掘 特征选择 randomForest importance 统计 微博 信息

沙发
吴_楚 发表于 2016-6-22 18:31:04
可以用word2vec

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-18 01:21