楼主: peylinn8
353 2

[学习笔记] 【学习笔记】2019/12/26 《No.25: p193-p200》《增强型分析-AI驱动的数据分析 ... [推广有奖]

  • 0关注
  • 6粉丝

副教授

4%

还不是VIP/贵宾

-

威望
0
论坛币
3852 个
通用积分
378.7263
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2958 点
帖子
532
精华
0
在线时间
3 小时
注册时间
2017-3-31
最后登录
2023-10-31

楼主
peylinn8 发表于 2019-12-26 09:01:26 来自手机 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
2019/12/26
《No.25: p193-p200》《增强型分析-AI驱动的数据分析、业务决策与案例实践》读书笔记
第6章 深入探讨CNN

6.4 一个例子,文本分类
文本分类的运用场景: 包括情感分析(正面/负面情绪);类别划分(网络上发言属于何种类型);人机对话等。
6.4.1 采用传统分类模型实现文本分类
  1.基于TF-IDF构建文本分类模型,比较常用的是多项式朴素贝叶斯,这种算法是基于”所有词汇都是相对于其他词汇而独立的假设”。
  2.若出现的概率为0,要用”拉普拉斯平滑”算法来估算。
  3.采用sklearn工具提供的朴素贝叶斯算法MultinomialNB来进行文本分类。
  4.使用混淆矩阵进行可视化检视。遇到多类别分类时很好用。

6.4.2 采用CNN进行文本分类
  1.目标变量向量化: 目标变量由一列数据转换为一个向量,Keras有工具包。
  2.利用词汇表进行字符转换: 用词汇表中每个词的索引将文本数据转换为数值数据。
  3.文本数据补齐: 每个文本长度需补齐为相同长度。Keras有工具包。
  4.定义CNN的结构: 按照预先的构想来定义CNN结构。
  5.CNN的模型训练
  6.模型预测结果的转换: 利用numpy工具将预测结果转换为一列类别数据

6.4.3 采用FastText进行文本分类
  1.FastText是开源工具,运行速度极快。模型效果不差。
  2.数据处理工作简单,只要按其格式要求,将类别标识放置在文本的前面即可。
  3.FastText并没有用深度学习的技术,可能是未来算法的技术趋势。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:学习笔记 数据分析 习笔记 增强型 Multinomial

沙发
512661101 发表于 2019-12-27 12:50:14 来自手机

藤椅
jessie68us 发表于 2020-1-27 14:29:12 来自手机

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-27 08:31