CDA Level Ⅱ:建模分析师。两年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证半年以上。在政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。在Level Ⅰ的基础之上深入掌握高级多元统计方法,并且拓展时间序列分析和主要数据挖掘的理论知识与业界运用;能够熟练使用SAS、R、Matlab和SPSS中至少一个专业统计软件实现相关算法;熟悉使用SQL访问企业级数据库;具有按照数据挖掘标准流程进行项目需求分析、数据验证、建模与模型评估的能力。
级别 | Level II |
理论 | 统计学、概率论和数理统计、多元统计分析、时间序列、数据挖掘(DM) |
软件 | 必要:EXCEL、SQL、SAS/SPSS 可选:R、MATLAB;SQL等(/表示“或”) |
分析方法要求 | 除掌握基本数据处理及分析方法以外,还应掌握高级数据分析及数据挖掘方法(多元线性回归法,生存分析法,神经网络,决策树,判别分析法,主成分分析法,因子分析法,典型相关分析,聚类分析法,关联规则,支持向量机,bagging,boosting等)和可视化技术。 |
业务分析能力 | 至少在客户关系管理、管理会计、信用风险管理、人力资源管理等其中一个数据分析的常用领域内具有深入的业务经验,可以将业务目标转化为数据分析目标;熟悉企业内数据的生成过程,可以熟练的访问常见数据库;根据项目需求,以最快捷的方式获取业界最新案例和学界最新研究成果,并且转化为行动方针;可以熟练的提取所需信息,能够从海量数据中搜集并提取信息;根据项目目的,结合业务经验选取最优建模方法。 |
结果展现能力 | 报告体现数据挖掘的整体流程,层层阐述信息的收集、模型的构建、结果的验证和解读,对行业进行评估,优化和决策。 |
CDA Level Ⅱ培训课程安排
背景介绍
CDA Level Ⅰ为基础薄弱的学员提供了入行的机会,能够结合业务完成基本的数据分析并作出数据报告。但企业想要在竞争激烈的市场中胜出,决策的速度和反应的效率尤为重要。根据调查显示,75%的企业在面临拟定策略时,常常无法获得实时且有根据的决策信息。什么样的数据、要通过什么样的方法,才能快速便捷的提供对决策有价值的信息,是现代企业所面临最迫切性的问题。因此,在CDA Level Ⅰ的基础上,CDA Level Ⅱ(建模分析师)即为企业决策提供及时有效、易实现、可信赖的数据支持。
在建模分析师中,数据挖掘(Data Mining)技术无疑是他们最强有力的核心竞争力。数据挖掘强调与现有信息系统的整合,以提供决策者做决策时所需的情报,或转化成经营智慧,以作为调整营运策略方针的辅助工具。以顾客关系管理(CRM)为例,数据挖掘是整个顾客关系管理的核心。其不但可以准确的定位目标市场,进行精准营销,还可以帮助业务人员了解客户深层需求,针对大量客户进行客制化,也就是所谓的一对一营销。本课程的目的就是要针对数据挖掘整套流程,根据CDA Level Ⅱ大纲标准,以金融、电信、电商和零售业为案例背景,结合SAS Enterprise Miner和SPSS Moderler深入讲授数据挖掘的主要算法。并将SAS 编程和SQL进行有效的结合,讲授如何在实际工作中搭建数据挖掘环境,制定分类数据挖掘的标准流程,让学员胜任全方位的数据挖掘运用场景。
CDA LEVEL Ⅱ课程安排
项目名称 | CDA Level Ⅱ建模分析师系统培训 |
时间 | 北京:2015年10月15-11月1日(八天) 上海:2015年11月19-12月6日(八天) |
地点 | 面授班:北京,人大经济论坛教室 上海,铁道宾馆 远程班:在线同步直播 |
价格(元) | 面授:7400元 远程:5500元 |
优惠 | 1. 全日制学生及CDA LEVEL Ⅰ老学员8折优惠(学生证证明文件) 2. 同一单位三人及以上报名9折优惠,五人及以上8折优惠 3. CDA LEVEL Ⅰ等级资格证书持有者立省1000元 4. 同时报名参加LEVELⅠ和LEVEL Ⅱ享受8折优惠。 点击查看LEVEL Ⅰ课程详情 以上优惠不可叠加! |
证书认证 | 1. 可申请报考《CDA LEVEL Ⅱ等级认证证书》(荐:含金量高) 2. 可申请《数据分析师证书》(培训后即可得到) 以上双证皆自愿申请 |
现场班福利 | 全套视频资料,终身学习,在线答疑 午餐,咖啡茶歇,论坛币(1000个) |
课程收益
(1)了解什么是顾客关系管理;(2)了解顾客关系管理系统的架构及其组成元素;(3)了解如何利用顾客关系管理系统来进行营销活动;(4)了解什么是数据挖掘(Data Mining);(5)掌握数据挖掘技术的功能分类;(6)掌握数据挖掘技术的绩效增益;(7)了解数据挖掘技术的产业标准;(8)掌握如何利用数据挖掘技术来筛选关键变量(Key Attribute);(9)掌握如何利用数据挖掘技术来进行交叉销售(Cross-Selling);(10)掌握如何利用数据挖掘技术来评估客户的信用风险(Credit Risk); (11)了解如何利用数据挖掘技术来分析顾客行为、产生商业智慧并发展营销策略。(12)掌握如何使用数据挖掘工具SAS EM/SPSS Modeler来完成上述的各项工作。(13)掌握MySQL等主流数据库的使用。(14) 构建易实施的MySQL数据挖掘环境。(15)掌握构建信用打分卡的流程。
学员对象:
1)各行业数据分析、数据挖掘从业者
2)金融、电信、零售、医学等各行业业务数据分析人员
3)政府事业单位大数据及数据挖掘项目人员
4)数据挖掘岗位就业、提拔涨薪、技能优化等从业人员
5)对数据挖掘感兴趣的各界人员
学员基础要求:
1)掌握CDA LEVEL Ⅰ大纲要求,CDA LEVEL Ⅰ详情:https://bbs.pinggu.org/thread-3419416-1-1.html
2)报名赠送《SAS初级视频》+《R语言及数据挖掘视频》,提前观看视频做好预习工作。自行安装好SAS软件(带有EM模块),SPSS Modeler,MySQL及R软件。R软件的下载网址为"http://www.r-project.org/";MySQL的下载网址为"http://www.mysql.com/。
主要操作案例:
1. 营销客户分群:ABC银行的营销部门想要针对该银行客户的使用行为,进行分群分析,以了解现行客户对本行的往来方式,并进一步提供适宜的营销接触模式。该银行从有效户(近三个月有交易者),取出10万笔样本数据。依下列四种交易管道进行客户分群分析:传统临柜交易(TBM)、自动柜员机交易(ATM)、银行专员服务(POS)、电话客服(CSC)。演练重点为极端值数据处理、分群变量选择、衍生变量产出、分群参数调整与分群结果解释。
2. 网站使用行为关联分析:ABC音乐广播电台为了服务更多听众,设置了电台网站,让更多的在线听众也可以透过网站服务以随时掌握电台的各个节目信息,网站提供了流行音乐趋势(music streams)、音乐下载(podcasts)、新闻讯息(news streams)、在线收听(live Web )以及历史节目收听(archives)等服务功能页面。分析人员想要藉由关联分析以进一步了解在线听众的使用行为,做为网站服务功能更新的依据。分析样本为捞取近两个月约150万笔的客户事务数据。分析目的为依据使用者网站事务数据,利用关联分析演算方法产生网站使用行为关联规则。演练重点为产生关联分析数据集、进行关联分析、关联分析结果解释。
3. XYZ银行的消费金融部门想了解既有的小额信贷客户的信用行为状况,建立一风险预测模型,藉以调整最适的授信政策、客户的信贷利率与信用额度,一达到风险管控,另一部分透过产品调整达到客户维护,与刺激信用额度动用。分析样本数据3000笔,坏客户比例16%。分析目的为依据可能影响违约之风险因子,利用判定树等分类演算方法建立信贷客户之风险预测模型。演练重点为数据浏览、遗失值处理、衍生变量产出、数据集分割(训练、验证、测试数据集)、预测模型变量筛选、判定树预测模型建置、判定树模型参数设定与模型解读、跨模型评估方法。
4. 捐款流失预测:某退除役军人协会过去内部的运作经费部份来自一般民众的捐款。协会多透过寄发会刊等出版品给一般民众,以获得民众对协会更多的了解与捐款。这次协会想要从过去对曾捐款的流失会员所做的活动响应纪录,来建立一个预测模型,并应用在未来对于捐款流失的会员中找到潜在仍会捐赠的名单,定期再提供给他们协会讯息或纪念小卡等。该协会目前约有350万名的捐款会员。针对流失会员的定义为近一到两年已无捐款者。本次的接触活动会针对预测分析所找出的名单,寄发贺卡。所取的样本数据为有响应与无响应者为1:1的过度抽样。真实母体数据的响应率为5%。
5. 信用风险模型。
详细大纲
时 程 | 大纲内容 |
第1天 | 主题:顾客关系管理及基础数据挖掘技术 |
企业使用之范围: 说明企业如何利用顾客关系管理来进行营销活动 | |
理论介绍: 顾客关系管理系统的架构及其组成元素 企业如何利用顾客关系管理系统来进行营销活动 数据挖掘技术的功能分类 数据挖掘技术的绩效增益 数据挖掘技术的产业标准 数据挖掘基本观念与实际应用解说 | |
SAS EM & SPSS Modeler实务案例操作: Introduction to SAS Enterprise Miner(SAS EM) & IBM SPSS Modeler Getting Started with SAS EM 12.1 & IBM SPSS Modeler 16 Creating a EM Project, Library and Diagram Creating a SPSS Modeler Project | |
第1天 第2天 | 主题:基础数据挖掘技术 |
企业使用之范围: 说明企业如何利用数据前处理技术来进行数据的重整,建置数据仓库,以做为数据挖掘之输入 | |
理论介绍: 数据挖掘技术的流程-SEMMA vs. CRISP DM 数据前处理(Data Preprocessing)技术 Attribute Selection(字段选择) *Data Integration(数据整合) Data Cleansing(数据清洗): *Wrong Value(错误值), *Outlier(离群值), *Missing Value(遗失值) Attribute Enrichment(字段扩充): *内/外部数据的扩充方法 Data Coding(数据编码): *Data Transformation(数据转换), *Data Reduction(数据精简), *Record Reduction(记录精简), *Attribute Value Reduction(域值精简), *Attribute Reduction(字段精简) | |
SAS EM & SPSS Modeler实务案例操作: Defining a Data Source Exploring a Data Source * Exploring Source Data * Changing the Explore Window Sampling Defaults * Modifying and Correcting Source Data Managing Wrong Values/Outliers/Missing Values Transforming Inputs Recording Categorical Inputs | |
第2天 第3天 | 主题:进阶数据挖掘技术 |
企业使用之范围: 说明企业如何利用关键变量发掘技术来发掘对项目目标有效之关键变量,以做为数据挖掘之输入变量 | |
理论介绍: 训练数据与测试数据的产生方法 关键变量(Key Attributes)发掘技术 *卡方检定(Chi-square Test) *t检定及ANOVA检定(t Test & ANOVA Test) *利用决策树(Decision Tree)选择关键变量 | |
SAS EM & SPSS Modeler实务案例操作: Creating Training & Validation Dataset Variable Selection Using Partial Least Squares for Input Selection Using the Decision Tree for Input Selection | |
第3天 | 主题:进阶数据挖掘技术2 |
企业使用之范围: 说明如何利用分类技术之决策树来建立交叉销售(Cross-Selling)模型,以提升公司获利 | |
理论介绍: 分类之决策树(Decision Tree) | |
SAS EM & SPSS Modeler实务案例操作: Constructing a Decision Tree Model Optimizing the Complexity of Decision Trees Assessing a Decision Tree Understanding Additional Plots & Tables Automatic Tree Growth | |
第3天 | 主题:进阶数据挖掘技术3 |
企业使用之范围: 说明企业如何利用分类技术之神经网络、支持向量机及分类多模型整合来建立信用评分(Credit Scoring)模型,以降低公司损失 | |
理论介绍: 分类之神经网络(Neural Network) 分类之支持向量机(Support Vector Machine) 分类多模型整合(Ensemble)之装袋(Bagging)、增强(Boosting)学习 | |
SAS EM &SPSS Modeler实务案例操作: Training a Neural Network Selecting Neural Network Inputs Increasing Network Flexibility Using the AutoNeural Tool Constructing a Support Vector Machine Constructing Ensemble Models by Using Bagging and Boosting Techniques Model Comparisons | |
第4天 | 主题:进阶数据挖掘技术4 |
企业使用之范围: 说明企业如何利用模型评估技术来评估模型的优劣,以作为采用适当模型的准则 | |
理论介绍: 模型评估(Model Assessment)技术 | |
SAS EM & SPSS Modeler实务案例操作: Model Fit Statistics: * Comparing Models with Summary Statistics Statistical Graph: * Comparing Models with ROC Charts * Comparing Models with Score Rankings Plots * Adjusting for Separate Sampling Profit Matrix: * Evaluating Model Profit * Viewing Additional Assessments * Optimizing with Profit Internally Scored Data Sets: * Creating a Score Data Source * Scoring with the Score Tool * Exporting a Scored Table Score Code Modules: * Creating a SAS Score Code Module * Creating Other Score Code Modules | |
第4天 | 主题:进阶数据挖掘技术5 |
企业使用之范围: 说明企业如何利用预测(Prediction)技术之回归树及类神经网络来建立数值预测模型-如预测客户之年收入,以利公司设计营销活动 | |
理论介绍: 回归树(Regression Tree) 类神经网络(Neural Network)-非线性回归 | |
SAS EM & SPSS Modeler实务案例操作: Review and Set the Decision Tree Node Review and Set the Neural Network Node | |
第4天 | 主题:进阶数据挖掘技术6 |
企业使用之范围: 说明企业如何利用关联及序列分析技术来建立交叉销售(Cross-Selling)及提升销售(Up-Selling)模型,以提升公司获利 | |
理论介绍: 关联分析(Association Analysis) 序列分析(Sequence Analysis) | |
SAS EM & SPSS Modeler案例案例操作: Consolidating Categorical Inputs Market Basket Analysis Sequence Analysis | |
第5天 | SAS数据整理(涵盖SAS初级程序员知识) |
上午 | |
1、编程基础介绍 1.1 课程介绍与认证体系介绍 1.2 SAS 入门与基本语法 2 、访问数据 2.1 认识 SAS数据和逻辑库 2.2 深入理解 SAS 数据类型 | |
下午 | |
3、数据管理和操纵 3.1 数据验证与清洗 3.2 创建变量 3.3 数据转换 3.4 汇总数据 3.5 数据循环处理 3.6 合并 SAS数据集 3.7 重组数据集 | |
第二部分:SAS编程进阶(涵盖SAS高级程序员知识) | |
第6天 | 上午 |
1、SQL过程 1.1 简单查询 1.2 汇总数据 1.3 横向连接表 1.4 子查询 1.5 集合操作 1.6 数据字典 1.7 Data MERGE语句与SQL区别 | |
下午 | |
2、SAS宏语言 2.1 宏编译器的运行机制 2.2 宏变量 2.3 通过Data和sql步创建宏变量 2.4 宏变量函数 | |
第7天 | 上午 |
2.5 定义宏和定义宏参数 2.6 宏中的分支流程语句 2.7 宏中的循环流程语句 | |
下午 | |
2.8 SQL和宏的信息交换 2.9 宏的运用实例及练习 3、程序优化 3.1 抽样方法 3.2 使用索引 3.3 去除重复值 | |
| 第三部分:SAS数据挖掘建模(涵盖SAS商业数据分析师知识) |
第8天 | 上午 |
第1章:数据驱动的风险管理 第2章:信用卡违约预测模型案例流程 | |
下午 | |
第3章:建模准备 第4章:变量粗筛 第5章:数据清洗 第6章:变量压缩与调整变量 第7章:预测类模型 第8章:模型评估 第9章:阀值设置 第10章:数据挖掘方法选择与数据挖掘的误区 |
讲师简介
李御玺,教授,国立台湾大学资讯工程博士,铭传大学资讯工程学系教授,铭传大学大数据研究中心主任,中华数据挖掘协会理事,云南财经大学信息学院客座教授,浙江大学城市学院客座教授,厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问,SAS-Taiwan顾问。在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。
服务过的客户包括:中国工商局、中信银行、台新银行、联邦银行、新光银行、 新竹国际商业银行(现已并入渣打银行)、第一银行、永丰银行、远东银行、美商大都会人寿、嘉义基督教医院、台湾微软、零售业如赫莲娜(Helena Rubinstein)化妆品公司、特立和乐(HOLA)公司、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司;政府行业如国税局等。
常国珍,曾为德勤管理咨询高级数据挖掘咨询顾问,SAS官方培训资深讲师,2014年SAS软件大赛判卷人,曾以数据挖掘工程师身份就职于亚信科技(中国)有限公司市场部。具有八年的数据挖掘实战经验,主攻分类模型,涉及客户精准营销、信用评估、价值提升、欺诈侦测和流失预警等数据挖掘主题,尤其熟悉银行个人客户精准营销的建模工作。
资格认证:SAS全球认证“Certified Statistical Business Analyst Using SAS 9 Regression and Modeling”、“Certified Advanced Programmer for SAS 9”。
参与项目:1、某国有大型银行企业级模型试验室建设; 2、某国有大型银行企业级欺诈系统建设;3、某股份制大型银行信用卡部产品精准营销建模和行为信用评级模型优化工作; 4、某股份制大型银行零售业务部客户忠诚度提升项目。
资格认证
CDA数据分析师LEVEL Ⅱ资格证书
(此证书为CDA协会颁发,人大经济论坛国内主办,全国统考,一年两次,此证书为CDA数据分析师唯一认证证书,可以作为企业事业单位选拔和聘用专业人才的任职参考依据。)
CDA考试安排:
1. 考试时间2015年12月27日
2. 考试内容:CDA LEVLE Ⅱ建模分析师大纲。
3. 报名费用:1500元/人。参加CDA系统培训学员费用为1000/人。
4. 其他:CDA考试一次不过可申请补考,补考费用为原价一半。证书3年审核一次。
5. 报考链接:http://cda.pinggu.org/online_registration.html
数据分析师证书
此证书参加CDA培训后随堂考试,通过即可获得,证书申请费用为400元。(可自愿申请)
报名流程
1.在线填写报名信息
2.给予反馈,确认报名信息
3.网上缴费
4.开课前一周发送电子版课件和教室路线图
【咨询方式】
电话:010-68454276
手机:17600807409(周老师)QQ:2881989708
18515667476(刘老师)QQ:2881989707
邮箱:zhoulei@pinggu.org
ljbing@pinggu.org
——Join Learn!
微博关注:@CDA数据分析师_人大经济论坛
QQ交流群:274123859
微信订阅:CDA数据分析师
点击加入