这个是github上最新翻译的《面向机器学习的特征工程》
主要内容如下:
[td]
标题 | ||
一、引言 | ||
二、简单数字的奇特技巧 | ||
三、文本数据:展开、过滤和分块 | ||
四、特征缩放的效果:从词袋到 TF-IDF | ||
五、类别特征:机器鸡时代的鸡蛋计数 | ||
七、非线性特征提取和模型堆叠 | ||
八、自动化特征提取器:图像特征提取和深度学习 | ||
九、回到特征:将它们放到一起 | ||
附录、线性模型和线性代数基础 |
这个是他们翻译过来的,
github网站:https://github.com/apachecn/feature-engineering-for-ml-zh
希望可以帮助到大家(不需要下载任何东西,可以在线看)
概括提示
作者建议本书中的插图最好以彩色显示。真的,你应该在第 7 章中打印出彩色版本的“瑞士卷”,然后粘贴到你的书中。你的审美意识会感谢我们。
特征工程是一个广泛的话题,每天都在发明更多的方法,特别是在自动特征学习方面。为了将本书的范围限制在一个可管理的大小,我们不得不做一些削减。本书没有讨论音频数据的傅里叶分析,但它是一个与线性代数中的特征分析密切相关的美丽主题(我们在第 4 章和第 6 章中会介绍)。我们也忽略了与傅立叶分析密切相关的随机特征的讨论。我们通过对图像数据的深度学习来介绍特征学习,但不会深入到积极开发中的众多深度学习模型中。超出范围的还有先进的研究思路,如随机投影,复杂文本特征模型(如 word2vec 和 Brown 聚类)以及潜在空间模型(如潜在狄利克雷分析和矩阵分解)。如果这些话对你来说毫无意义,那么你很幸运。如果特征学习的前沿是你的兴趣所在,那么这可能不是为你准备的书。
本书假设掌握了基本机器学习概念的知识,例如“什么是模型”和“什么是矢量”。它并不要求掌握了数学或统计学。线性代数,概率分布和优化的经验是有帮助的,但不是必需的。
如果觉得不错希望大家在这个下面留个言哦