作者:Sibanjan Das和Umit Mert Cakmak
出版日期:2018年11月20日
发布日期:2018年11月20日
ISBN / ASIN:9781788629898
出版商: Packt Publishing
为更快的机器学习应用程序自动化数据和模型管道主要功能为不同的机器学习组件构建自动化模块深入了解机器学习管道的每个组件学习使用不同的开源AutoML和特征工程平台书籍描述AutoML旨在自动化部分机器学习。随时可用的AutoML工具使数据科学从业者的工作变得简单,并且在高级分析社区中得到了很好的接受。自动化机器学习涵盖了创建自动化机器学习模块所需的必要基础,并帮助您以最实用的方式快速掌握它们。在本书中,您将学习如何在机器学习管道中自动执行不同的任务,例如数据预处理,功能选择,模型培训,模型优化等等。除此之外,它还演示了如何使用可用的自动化库(如auto-sklearn和MLBox),以及为机器学习创建和扩展自己的自定义AutoML组件。
在本书的最后,您将更清楚地了解自动化机器学习的不同方面,并且您将能够使用实际数据集合并自动化任务。您可以利用本书中的知识在您的项目中实现机器学习,并更接近赢得各种机器学习竞赛。
您将学习什么
了解自动化机器学习系统的基础知识探索Auto-sklearn和MLBox for AutoML任务自动执行预处理方法以及功能转换使用Python堆栈增强功能选择和生成将ML的各个组件组装成完整的AutoML框架Demystify hyperparameter调整以优化您的ML模型深入了解机器学习概念,例如神经网络和自动编码器了解与AutoML相关的信息成本和权衡本书适合的人员如果您是一位崭露头角的数据科学家,数据分析师或机器学习爱好者,这本书是自动机器学习概念的新手,非常适合您。如果你'你也会发现这本书很有用 有兴趣为您的项目开发快速机器学习管道的ML工程师或数据专业人员。之前接触Python编程将帮助您充分利用本书。
第1章,介绍AutoML,为你潜水的基础奠定了基础。我们还将向您介绍各种自动化库。
第2章,使用Python的机器学习介绍,介绍了一些机器学习概念,以便您能够容易地遵循AutoML方法。
第3章,数据预处理,深入了解不同的数据预处理方法,哪些可以自动化,以及如何自动化。本文将介绍特征工具和自动SKEXCEL预处理方法。
第4章,自动算法选择,提供了关于哪种算法最适合于哪种数据集的指导。我们学习了不同算法的计算复杂度和可伸缩性,以及基于训练和得分时间来决定使用算法的方法。我们演示了自动SkSead以及如何将其扩展到包括新算法。
第5章,超参数优化,为您提供了自动化超参数调优各种变量所需的基础。
第6章,创建AutoML管道,解释了将各种组件拼接在一起以创建端到端的AutoML管道。
第7章,深入学习,介绍各种深度学习的概念以及它们对AutoML的贡献。
第8章,ML和数据科学项目的关键方面,总结讨论并提供了关于AutoML项目的复杂性和成本的各种权衡的信息。