- 阅读权限
- 255
- 威望
- 1 级
- 论坛币
- 30460 个
- 通用积分
- 2307.2886
- 学术水平
- 13 点
- 热心指数
- 25 点
- 信用等级
- 3 点
- 经验
- 102332 点
- 帖子
- 18514
- 精华
- 0
- 在线时间
- 10321 小时
- 注册时间
- 2020-12-8
- 最后登录
- 2024-11-6
巨擘
还不是VIP/贵宾
- 威望
- 1 级
- 论坛币
- 30460 个
- 通用积分
- 2307.2886
- 学术水平
- 13 点
- 热心指数
- 25 点
- 信用等级
- 3 点
- 经验
- 102332 点
- 帖子
- 18514
- 精华
- 0
- 在线时间
- 10321 小时
- 注册时间
- 2020-12-8
- 最后登录
- 2024-11-6
| 开心 2024-10-22 08:20:20 |
---|
签到天数: 1371 天 连续签到: 1 天 [LV.10]以坛为家III
|
相似文件
换一批
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
XGBoost与LightGBM文本分类源代码商品评论数据集Word2Vec进行词向量的生成
可直接运行,1、内容概要:本资源主要基于XGBoost与LightGBM实现文本分类,适用于文本分类使用。2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train,训练好的word2vec词向量模型w2v_model.pkl和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。4、源代码:xgboost_model.py是基于xgboost模型对文本进行分类。5、源代码:lightGBM_model.py是基于lightGBM模型对文本进行分类。
XGBoost与LightGBM文本分类源代码商品评论数据集Word2Vec进行词向量的生成.zip
(37.99 MB, 需要: RMB 29 元)
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|
|
|