作者:Bhargav Srinivasa-Desikan [Bhargav Srinivasa-Desikan]
出版日期:2018年11月20日
发布日期:2018年11月20日
ISBN ASIN:9781788837033
使用Python和强大的开源工具(如Gensim和spaCy)来执行现代文本分析,自然语言处理和计算语言学算法。
主要特点
探索开源Python文本分析生态系统,使用spaCy,Gensim,scikit-learn和Keras
实践文本分析,使用Python,自然语言处理和计算语言学算法
学习文本分析的深度学习技巧
书籍描述
现代文本分析现在可以使用Python和开源工具轻松访问,因此您将了解如何在这个文本数据时代执行现代文本分析。
本书向您展示了如何使用自然语言处理和计算语言学算法来推断和获得有关您拥有的数据的见解。这些算法基于统计机器学习和人工智能技术。现在可以使用这些算法的工具 - 使用Python,以及Gensim和spaCy等工具。
您将首先了解数据清理,然后从第一个概念开始执行计算语言学。然后,您就可以使用Python,使用逼真的语言和文本样本来探索更复杂的统计NLP和深度学习领域。您将学习使用最佳工具标记,解析和建模文本。您将获得使用最佳框架的实际知识,并且您将知道何时为主题模型选择像Gensim这样的工具,以及何时与Keras合作进行深度学习。
本书平衡了理论和实践动手实例,因此您可以了解并开展自己的自然语言处理项目和计算语言学。您'
您将学到什么
为什么文本分析在我们现代时代非常重要
了解NLP术语并了解Python工具和数据集
了解如何预处理和清理文本数据
将文本数据转换为向量空间表示
使用spaCy处理文本
训练您自己的NLP模型计算语言学
使用统计学习和主题建模算法文本,使用Gensim和scikit学习
使用Keras聘请了文本分析深度学习技术,
这本书是为谁
这本书是给你的,如果你想深入探究,动手第一进入有趣的文本分析和NLP世界,您就可以使用丰富的Python生态系统工具和数据集等着您!
目录
什么是文本分析?
用于文本分析的Python技巧
spaCy的语言模型
Gensim - 矢量化文本和转换以及n-gram
POS标记及其应用程序
NER标记及其应用程序
依赖性解析
顶级模型
高级主题建模
聚类和分类文本
相似性查询和摘要
Word2Vec,Doc2Vec和Gensim
深度学习文本
Keras和spaCy用于深度学习
情感分析和ChatBots
**
关于作者
Bhargav Srivinasa-Desikan是法国里尔INRIA的学生研究员。他是MODAL(数据分析和学习模型)团队的一员,他致力于度量学习,预测器聚合和数据可视化。他还为开源机器学习项目做出了贡献,尤其是Gensim的动态主题模型。