你好,欢迎来到经管之家 [登录] [注册]

设为首页 | 经管之家首页 | 收藏本站

广州数据分析师数据挖掘_数据挖掘方向_数据挖掘的含义

广州数据分析师数据挖掘_数据挖掘方向_数据挖掘的含义




广州数据分析师数据挖掘,数据挖掘方向,数据挖掘的含义:


数据挖掘(Data Mining) 就是从大量数据中发现潜在规律、提取有用信息的方法和技术。因为与数据库密切相关,又称为数据库知识发现(Knowledge Discovery in Databases, KDD) ,就是将高级智能计算技术应用于大量数据中,让计算机在有人或无人指导的情况下从海量数据中发现潜在的,有用的模式(也叫知识)。


广义上说,任何从数据库中挖掘信息的过程都叫做数据挖掘。从这点看来,数据挖掘就是 BI(商业智能)。但从技术术语上说,数据挖掘(Data Mining) 特指的是:源数据经过清洗和转换等成为适合于挖掘的数据集。数据挖掘在这种具有固定形式的数据集上完成知识的?炼,最后以合适的知识模式用于进一步分析决策工作。从这种狭义的观点上,我们可以定义:数据挖掘是从特定形式的数据集中提炼知识的过程。


数据挖掘往往针对特定的数据、特定的问题,选择一种或者多种挖掘算法,找到数据下面隐藏的规律,这些规律往往被用来预测或支持决策。


数据挖掘的主要功能


1) 分类:按照分析对象的属性、特征,建立不同的组类来?述事物。例如:银行部门根据以前的数据将客户分成了不同的类别,现在就可以根据这些来区分新申请贷款的客户,以采取相应的贷款方案。


2) 聚类:识别出分析对内在的规则,按照这些规则把对象分成若干类。例如:将保险申请人区分为高度风险申请者,中度风险申请者,低度风险申请者。


3) 关联规则和序列模式的发现:关联是某种事物发生时其他事物随之发生的这样一种联系。例如:每天购买啤酒的人也有可能购买香烟,比重有多大,可以通过关联的支持度和可信度来?述。与关联不同,序列是一种纵向的联系。例如:今天银行调整利率,明天股市的变化。


4) 预测:把握分析对象发展的规律,对未来的趋势做出预见。例如:对未来经济发展增速的判断。


5) 偏差的检测:对分析对象的少数的、极端的、特例的?述,以揭示其内在的原因。例如:在银行的 100 万笔交易中有 500 例欺诈行为,银行为了稳健经营,就要找出这 500 例欺诈行为的内在因素,减小以后的经营风险。


需要注意的是:数据挖掘的各项功能不是独立存在的,它们在数据挖掘中互相联系,共同发挥作用。
推荐阅读
经济学相关文章
标签云
经管之家精彩文章推荐