楼主: yusb
191 0

[经管数据集] XGBoost与LightGBM文本分类源代码商品评论数据集Word2Vec进行词向量的生成 [推广有奖]

巨擘

0%

还不是VIP/贵宾

-

威望
1
论坛币
30460 个
通用积分
2307.2886
学术水平
13 点
热心指数
25 点
信用等级
3 点
经验
102332 点
帖子
18514
精华
0
在线时间
10321 小时
注册时间
2020-12-8
最后登录
2024-11-6

楼主
yusb 在职认证  发表于 2024-1-5 20:35:04 |只看作者 |坛友微信交流群|倒序 |AI写论文
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
XGBoost与LightGBM文本分类源代码商品评论数据集Word2Vec进行词向量的生成

可直接运行,1、内容概要:本资源主要基于XGBoost与LightGBM实现文本分类,适用于文本分类使用。2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train,训练好的word2vec词向量模型w2v_model.pkl和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。4、源代码:xgboost_model.py是基于xgboost模型对文本进行分类。5、源代码:lightGBM_model.py是基于lightGBM模型对文本进行分类。


XGBoost与LightGBM文本分类源代码商品评论数据集Word2Vec进行词向量的生成.zip (37.99 MB, 需要: RMB 29 元) b5eb3bc0b898acb46a94142d7b3b376.png




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:boost Light 商品评论 word 词向量

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-6 08:19