1 论文标题:基于FastText模型的匿名数据文本分类研究
2 作者信息:朱美瑶, 张寅昊, 王宇喆, 钟美君:嘉兴南湖学院信息工程学院,浙江 嘉兴
3 出处和链接:朱美瑶, 张寅昊, 王宇喆, 钟美君. 基于FastText模型的匿名数据文本分类研究[J]. 统计学与应用, 2023, 12(2): 563-568. https://doi.org/10.12677/SA.2023.122060
4 摘要:本文主要讨论在数据匿名化情况下,FastText模型相比其它机器学习模型,对文本分类问题是否是更优解。本文对公开新闻数据集的20万条中文文本数据进行匿名化处理,然后分别采用逻辑回归、LGBM、随机森林和FastText模型进行分类,并且针对结果,对FastText提出两方面的改进,通过多个评价指标进行评价后,FastText模型无论在准确率上,还是在运行效率上,均比其它模型更优秀。