发帖

楼主: caisinong

1767 1

[问题] 文本挖掘特征选择：该用什么方法？ [推广有奖]

1关注
0粉丝

已卖：182份资源

大专生

40%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 101 个
通用积分: 0.1914
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 316 点
帖子: 18
精华: 0
在线时间: 73 小时
注册时间: 2010-10-2
最后登录: 2022-10-24

楼主

caisinong 发表于 2016-5-2 22:59:48 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

我在尝试用文本挖掘来处理微博信息，在特征选择被卡住了：我试了两种，一种是词频统计后人工筛选前X百个，一种是randomforest的importance项筛选前X百个，发现前者在训练时效果更好。但二者在后面分析新数据时效果都一般，一眼扫过去分类分得乱七八糟。

后来还看到tfidf，但因为我分析微博数据，不知道总文档库该去哪找，感觉无法实行了。

求教大神们都用什么方法来做这个事情呀？十分感谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：什么方法文本挖掘特征选择 randomForest importance 统计微博信息

[问题] 文本挖掘特征选择：该用什么方法？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

[问题] 文本挖掘特征选择：该用什么方法？ [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群