大家都知道,统计学是数据挖掘中一个很重要的基础学科,有时候我也迷迷糊糊不太说得清“数据分析”和“数据挖掘”这两个概念的本质区别,一直只知道数据挖掘是基于模型的。下面是从是否有前提假设的角度阐述了数据挖掘和统计方法的区别。

通常的统计方法是在已有的假设基础上,从大量数据中得到验证,而数据挖掘则是从大量的数据中得到崭新的模式、结论和假设;数据挖掘是纯粹的给予数据驱动的方式,而统计方法则更多地引入人为因素并加以分析。探索式数据分析是统计方法中与数据挖掘最相似的分支,但它所面向的数据集还是比数据挖掘对象小很多。
《谁说菜鸟不会数据分析》里面对数据分析和数据挖掘的关系是这样说的“数据挖掘其实是一种高级的数据分析方法。数据挖掘就是从大量的数据中挖掘出有用的信息,它是根据用户的特定要求,从浩如烟海的数据中找出所需的信息,以满足用户的特定需求。数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。一般来说,数据挖掘主要侧重解决四类数据分析问题:分类、聚类、关联和预测。”



雷达卡




京公网安备 11010802022788号







