数据整理时进行企业数据挖掘的前提和基础,占用了整个项目的大部分时间,其设计优劣直接关接到整个企业项目的成败。ETL 的实现有多种方法。常用工具如Oracle 的OWB、SQL server 2000 的DTS、SQL Server2005 的SSIS 服务、informatic 等实现,再者就是SQL 方式实现,此外是ETL 工具和SQL 相结合方式。项目组考虑到进一步数据挖掘的需要,采用了SAS/SQL 工具来进行银企的ETL过程。
3.1 ETL 过程
ETL 过程是将数据库系统的数据经过抽取、清洗转换之后加载进入数据仓库的过程。实现该过程的目的是将银企中的分散、零乱、标准不统一的数据整合到一起,为数据分析与挖掘建立必要前提。ETL 是商业智能最重要的一个环节,占用了整个项目的大部分时间,其设计优劣直接关接到商业智能项目的成败。ETL 的实现有多种方法。常用工具如Oracle 的OWB、SQL server 2000 的DTS、SQL Server2005 的SSIS 服务、informatic 等实现,再者就是SQL 方式实现,此外是ETL 工具和SQL 相结合方式。项目组考虑到进一步数据挖掘的需要,采用了SAS/SQL 工具来进行银企的ETL 过程。
数据的抽取需要在调研阶段做大量工作。需要解决诸多问题:从不同类型的业务系统中发现数据;整合各业务系统的数据库服务器DBMS;高效整理非结构化的数据以及手工录入部分数据等等。在收集完这些信息之后,才可以进行如下内容的数据抽取设计:......
人大经济论坛数据挖掘培训:
https://bbs.pinggu.org/thread-1409460-1-1.html
人大经济论坛数据处理和分析研究中心:
http://data.pinggu.org
数据挖掘在银企客户识别中的应用-连载(一):https://bbs.pinggu.org/thread-1491064-1-1.html
数据挖掘在银企客户识别中的应用-连载(二):https://bbs.pinggu.org/thread-1491714-1-1.html
数据挖掘在银企客户识别中的应用-连载(三):https://bbs.pinggu.org/thread-1492572-1-1.html
数据挖掘在银企客户识别中的应用-连载(四):https://bbs.pinggu.org/thread-1493272-1-1.html
数据挖掘在银企客户识别中的应用-连载(五):https://bbs.pinggu.org/thread-1494898-1-1.html
数据挖掘在银企客户识别中的应用-连载(六):https://bbs.pinggu.org/thread-1496013-1-1.html
数据挖掘在银企客户识别中的应用更多精彩内容,敬请期待~~~