数据挖掘导论对于数据挖掘的学习来说非常重要,对数据挖掘的学习起到了引导的作用,只有基础打得好数据挖掘后面的学习才会更轻松。我们怎样才能学好数据挖掘呢? 数据挖掘学习方法: 第一阶段:掌握数据挖掘的基本概念和方法。先对数据挖掘有一个概念的认识,并掌握基本的算法,如分类算法、聚类算法、协同过滤算法等。 第二阶段:掌握大数据时代下的数据挖掘和分布式处理算法。现在已经进入大数据时代,传统的数据挖掘算法已经不适用于 第三阶段:使用Hadoop进行大数据挖掘。Hadoop里面有一个Mahout组件,几乎包括了所有的数据挖掘算法,包括分类、聚类、关联规则等。 另外,数据挖掘是数据库技术、人工智能技术、机器学习技术、统计学习理论、数据可视化等一系列技术的综合,所以,要想学好数据挖掘,这些技术也得懂的呀。 数据挖掘导论中的九大定律: (1)Business Goals Law:每个数据挖掘解决方案的根源都是有商业目的的。 (2)Business Knowledge Law:数据挖掘过程的每一步都需要以商业信息为中心。 (3)Data Preparation Law:数据挖掘过程前期的数据准备工作要超过整个过程的一半。 (4)NFL Law:NFL(没有免费午餐,No Free Lunch)。对于数据挖掘者来说没有免费的午餐,数据挖掘的任何一个过程都是来之不易的。 (5)Watkins’ Law:此定律以此命名是因为David Watkins首次提出这个概念。这个定律说的是在数据的世界里,总是有模式可循的。您找不到规律不是因为规律不存在,而是因为您还没有发现它。 (6)Insight Law:数据挖掘可以把商业领域的信息放大。 (7)Prediction Law:预测可以为我们增加信息。 (8)Value Law:数据挖掘模式的精准和稳定并不决定数据挖掘过程的价值,换句话说技术手段再精妙,没有商业意义和合适的商业应用是没有价值的。 (9)Law of Change:所有的模式都会变化。 数据挖掘导论书籍推荐: 《数据挖掘概念和技术》(第三版)范明,孟小峰 译著。 《大数据:互联网大规模数据挖掘和分布式处理》 王斌 译著。 《Hadoop实战(第二版)》.陆嘉恒 著。 数据挖掘已经越来越流行了,很多已经工作的人也开始学习数据挖掘并且报了很多培训班,希望为自己以后的事业有一点帮助。但如果学好了数据挖掘以后的就业前景一定会非常不错。