请选择 进入手机版 | 继续访问电脑版
楼主: 资料狂人
1290829 157

[学习分享] 【R语言数据挖掘】大数据时代的精准数据挖掘11月北京/远程开班   [推广有奖]

运营管理员

巨擘

0%

还不是VIP/贵宾

-

威望
9
论坛币
975186496 个
通用积分
41073.0715
学术水平
4617 点
热心指数
3402 点
信用等级
3620 点
经验
633859 点
帖子
9569
精华
140
在线时间
18129 小时
注册时间
2010-4-30
最后登录
2024-3-19

初级热心勋章 初级学术勋章 中级学术勋章 中级热心勋章 初级信用勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章 特级信用勋章 特级学术勋章

资料狂人 在职认证  发表于 2014-11-18 11:06:27 |显示全部楼层 |坛友微信交流群
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
R语言2016年数据挖掘现场班
通过案例掌握R语言数据挖掘


时间2016年11月25-28日 (四天)
地点:北京市海淀区厂洼街3号丹龙大厦

安排:上午9:00-12:00;下午1:30-4:30;答疑4:30-5:00
费用4500元 / 3600元 (仅限全日制本科生及硕士研究生优惠价);食宿自理

          远程:3600元
优惠:现场班老学员9折优惠;
          同一单位3人以上同时报名9折优惠;
          同一单位6人以上同时报名8折优惠;
          折扣优惠不叠加。
详情请参照回复   

我要报名

报名流程:
1:点击“我要报名”,网上填写信息提交;
2:给予反馈,确认报名信息;
3:进入结算中心,通过订单支付;
4:开课前一周发送课程电子版讲义,软件准备及交通住宿指南。


联系方式:

魏老师
QQ:1143703950 点击这里给我发消息
Mail:vip@pinggu.org
Tel: 010-68478566



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:大数据时代 数据挖掘 R语言 大数据 数据挖掘现场班 北京市 厂家直销 海淀区 研究生 本科生

回帖推荐

clips 发表于136楼  查看完整内容

还是物有所值的,Gino老师讲课时分享多年的数据处理和挖掘的经验,高屋建瓴的帮助理解数据分析精髓,豁然开朗,有一种学习收获的喜悦,这些东西在书上是学不到的。虽然时间飞快的短短几天,但回去再看书或者应用于工作实践,就感觉轻松很多,原来那些难以理解的东东,变得易于理解了。希望多来上海开班。(这次听Gino老师说以后少开班或者不开班了,希望开下去,让更多的人受益。)
已有 6 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
醉客天涯 + 100 + 1 + 1 + 1 精彩帖子
xujingtang + 60 精彩帖子
dmer数据分析 + 4 http://dmer.cn 数据分析师视频教程
reduce_fat + 100 鼓励积极发帖讨论
saspalm + 2 + 2 + 2 精彩帖子
zli08 + 1 + 1 + 1 精彩帖子

总评分: 经验 + 260  论坛币 + 4  学术水平 + 4  热心指数 + 4  信用等级 + 4   查看全部评分



资料狂人 在职认证  发表于 2014-11-18 11:06:28 |显示全部楼层 |坛友微信交流群

大数据时代的精准数据挖掘——使用R语言


老师简介:

      Gino老师,即将步入不惑之年,早年获得名校数学与应用数学专业学士和统计学专业硕士,有海外学习和工作的经历,近二十年来一直进行着数据分析的理论和实践,数学、统计和计算机功底强悍。

      曾在某一世界500强公司核心部门担任高级主管负责数据建模和分析工作,在实践中攻克统计建模和数据分析难题无数,数据处理与分析科学精准,在实际应用中取得良好的效果。

     Gino老师担任数据分析培训师多年,探索出一套以实例讲解带动统计原理理解和软件操作熟悉的方法,授课的学生能迅速理解统计原理并使用统计软件独立开展数据分析。

     Gino老师先后使用过多种计算机语言或软件,最终选用R作为统计分析的利器,在R的使用上具有丰富的实战经验。


课程简介:

      本课程结合讲师的学习和工作经验,把R语言和数据挖掘的基本知识和重点难点很好的结合,注重学以致用,按照由深入浅的方式,层层推进使得学员拾阶而上的逐级掌握相关内容。

      课程内容涵盖了R语言和数据挖掘的精华,从大纲来看,无论是流行的数据挖掘方法,还是前沿的算法均有所涉及,课程中提供了大量丰富的案例,这些案例,集合了互联网、市场营销、金融保险等领域的数据挖掘实例,无疑对学习和工作有极大的参考和指导意义。


课程特色:

      1. 本课程尽量避开数学公式,按照“讲清思想方法原理—结合具体案例—R语言实现细节”思路,让即使是几乎没有什么基础的学员,掌握R语言数据挖掘的基本思路和模式,打下未来深入的良好基础,能在工作和学习中结合具体问题立马上手操作解决;

      2. 课程注重学练结合的方法,会采取小组讨论的方法,充分调动大家思考的积极性,在做中掌握相关知识和技能;

      3. 课程紧紧抓住R语言和数据挖掘的重点和难点,详细的分析和讲解,在理解难、容易出错的地方反复提醒,以便学员在课后容易的进行自己复习和相关拓展。


目标人群:

     对使用R语言进行数据挖掘感兴趣者,尤其是希望获得R语言和数据挖掘基础和思想,想在实际中快速使用R语言进行数据挖掘以解决问题的在校学生、在职工作者。


教学大纲:

讲:R语言精要

本着循序渐进而又覆盖R语言重要而有用的基本内容原则,本讲从R语言入门开始,以前期的数据处理为核心,以实际案例为载体,内容包括R语言的向量、数据框、矩阵运算、缺失值和零值的处理、特别注重用R语言构造函数编程解决实际问题,详细介绍强大的数据清洗整理plyr、zoo、car等常用包和强大的作图ggplot2包,为使用R语言进行数据挖掘打下扎实的工具基础。

主要案例:

案例1:如何用R语言plyr等包合并、排序、分析数据并编制香农-威纳指数;

案例2:如何用R语言编程同时实现几十个高难度数据分析可视化图片的jpeg格式输出;

案例3:如何使用R语言进行分层或者整群抽样构建训练集与测试集;

案例4:使用ggplot2画出各种复杂的图形。


第二讲:Logistic回归与商业大数据建模

Logistic回归是商业建模的常用重要数据挖掘方法,本讲要讲清楚Logistic回归的建模原理、与多元线性模型的区别、R语言实现过程及回归诊断注意事项、预测方法和结果解释,让学员彻底地掌握Logistic回归解决问题的R语言方法。

主要案例:

案例1:利用Logistic回归帮助商业银行完成对客户提前还贷款情况的预测;

案例2:利用Logistic回归帮助医生对病人选择治疗方案;

案例3:利用Logistic回归帮助厂家分析顾客做出购买决策的重要因素;

案例4:利用Logistic回归帮助寿险公司进行目标客户精准电话营销;

案例5:利用Logistic回归帮助商业银行完成对客户的信用评分;

案例6:利用Logistic回归帮助公司分析客户流失的原因并做好预测。


第三讲:关联规则和R语言实现

关联规则(著名的“啤酒和尿布”)是数据挖掘的基础和核心技术之一,本讲将着重围绕经典的Apriori算法和eclat算法,阐明关联规则的支持、置信和提升程度与控制,使用R语言快速完成关联规则分析。

主要案例:

案例1:使用R语言关联规则方法帮助各个超市实现商品的捆绑销售方案(即“购物篮”分析);

案例2:泰坦尼克号乘客幸存的关联规则分析;

案例3:提高个人收入的关联分析。


第四讲:决策树(回归树)分析和R语言实现

决策树是数据挖掘的经典方法,其原理容易被理解。本讲主要讲授两种最为普遍的决策树算法:CART和C4.5算法,使用rpart和J48函数进行R语言分析。

主要案例:

案例1:对汽车耗油量进行决策树分析并完成相关目标变量的预测;

案例2:使用决策树帮助电信局判断和预测客户办理宽带业务。


第五讲:机器集成学习的Bagging和AdaBoost算法

这两种方法将许多分类器的预测结果进行汇总分析,从而达到显著提升分类效果。本讲介绍这2种算法的思想,在R语言中构造训练集和测试集进一步进行分析。

主要案例:

案例1:用R语言的Bagging和AdaBoost进行商业银行定期存款的分析和预测;

案例2:用R语言的Bagging和AdaBoost识别有毒蘑菇。


第六讲:R语言随机森林(RandomForest)算法

在机器学习中,随机森林是一个包含多个决策树的分类器,本讲讲清随机森林方法的原理,以致在实际中帮助学员判断适合进行随机森林分析的情况,最终熟练掌握R语言随机森林分析的方法。

主要案例:

案例1:对皮肤病进行随机森林的分类和预测;

案例2:对酒的品质和种类进行分类和评价。


第七讲:支持向量机和R语言的实现

本讲将分析支持向量机的结构风险最小原理、间隔和核函数,从而帮助学员深刻理解支持向量机的思想和算法,以及使用中注意的问题,从而帮助学员灵活地应用于各个领域。

主要案例:

案例1:对著名的鸢尾花数据进行支持向量机的分析;

案例2:使用支持向量机识别有毒蘑菇;

案例3:使用支持向量机进行股票指数预测。


第八讲:神经网络和R语言的实现

神经网络由大量的节点和输出函数构成逻辑策略,本讲介绍其原理,主要通过案例的方式讲解R语言实现神经网络算法的过程和注意的事项。

主要案例:

案例1:酒的品质和种类的神经网络的分析和预测;

案例2:公司财务预警建模。


第九讲:交叉验证比较各个模型

对于同一个数据,可能有很多模型来拟合,如何衡量和比较模型的精度呢?本讲将介绍交叉验证训练集和测试集的方法来帮助大家在实际中选取模型进行拟合和预测。


第十讲:使用R语言结合KNN算法进行文本挖掘

文本挖掘,特别是对中文的文本挖掘日趋重要。本讲介绍文本挖掘的原理和方法,帮助大家使用R语言在大量的非结构化的数据中发现有价值的信息,抽取潜在有用的数据,发现适合模式,实现可视化结果展示。

主要案例:

案例:使用R语言结合KNN算法对网页(Web)进行文本挖掘(含分词、分类、可视化等)



使用道具

听说R很实用,能力很强,决定好好学学

使用道具

maeswnc 发表于 2014-11-24 01:31:54 |显示全部楼层 |坛友微信交流群
ggplot2

使用道具

快乐小雨 发表于 2014-12-18 09:19:07 |显示全部楼层 |坛友微信交流群
啥时候上海办一下

使用道具

blackgcm 发表于 2014-12-24 20:06:48 |显示全部楼层 |坛友微信交流群
在上海办就好了

使用道具

gxnnhsd 发表于 2015-2-16 09:21:52 |显示全部楼层 |坛友微信交流群
R很实用,很强大,培训费也很........

使用道具

   费用有点高啊

使用道具

kikisun416 发表于 2015-2-17 20:47:50 |显示全部楼层 |坛友微信交流群
想买Gino老师的DVD有买过的童鞋吗?

使用道具

yo12321 发表于 2015-2-24 01:31:34 |显示全部楼层 |坛友微信交流群
科普一下

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-19 17:13