楼主: littlelianglian
10336 69

[学科前沿] 【上海】数据挖掘培训课堂_元旦开课!   [推广有奖]

贵宾

学术权威

72%

还不是VIP/贵宾

-

威望
3
论坛币
497776 个
通用积分
9293.7569
学术水平
355 点
热心指数
303 点
信用等级
328 点
经验
105005 点
帖子
3169
精华
16
在线时间
3268 小时
注册时间
2013-9-4
最后登录
2023-12-23

一级伯乐勋章 初级学术勋章 初级信用勋章

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
对数据挖掘情有独钟,一心想要学习精通;
用SAS? R? Python?不会不想不愿编码肿么破?
幸运的小编在11月13-16号参加了李御玺老师的数据挖掘课程!
李老师的课程有什么好? 不用编码,点点鼠标,分分钟搞定数据挖掘。
SPSS MODELER就是这样,简单的操作;干净的界面;专业的数据挖掘软件!

...
数据挖掘实物及MODELER应用培训,并有十个案例(囊括各个行业)穿插在课程讲解中,您值得拥有!


以下为小编听了李老师的课程,并参照了《基于Clementine的数据挖掘》,将书上的一个小例子展现给大家

1.案例数据为一份关于药物研究的数据。患有同种疾病的不同病人,服用五种药物中的一种(drugA、drugB...)后,都取得了同样的治疗效果;现在需要利用数据挖掘技术发现以往药物处方适用的规律,对于不同特征(血压、胆固醇、钠钾含量等)的病人给予更适合哪种药物的建议。(数据在附件中)
                   捕获.PNG
2.观察各个变量的数据特征:可以看到MODELER对此计算除了最小值、最大值、均值、标准差、偏态系数等基本描述统计,同时还输出了数值型变量的直方图以及分类型变量的柱形图。
                  捕获1.PNG
3.通过散点图反应服用不同药物的病人钠钾含量指标; 图形显示服用drugY的病人,其唾液中的K含量明显低于其他类病人,由此可见,单纯K含量较低的病人选用drugY比较理想。
                捕获2.PNG
4.通过直方图反应钠钾浓度指标(Na/K)与服用对应药物的关系。图形显示,对于Na/K比值处在高水平的病人,drugY是理想的选择。
             捕获4.png
5.通过网状图反映不同血压特征病人的药物选择。图中线条粗细反映病人的BP与选用drug的情况。可以看到,无论血压状况如何,都可以服用drugY。
             捕获5.PNG
6.通过建立模型C5.0,从年龄 性别 血压 钠钾浓度指标的综合角度分析选择不同药物的依据。 根据图形显示,可以看出:Na/K比值是选择药物的首要考虑因素,其次是血压、年龄、和胆固醇水平。其中性别对药物选择没有影响。
            捕获6.PNG

学艺不精,各位见谅!




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘培训 挖掘培训 数据挖掘 SPSS Modeler clementine 挖掘培训 上海 课堂 课程 软件

DRUG.txt

7.84 KB

回帖推荐

littlelianglian 发表于2楼  查看完整内容

李御玺老师将于1月1-4号,在上海进行为期4天的数据挖掘讲座。具体信息请参照:https://bbs.pinggu.org/thread-3186035-1-1.html 案例1: 评估新车设计(汽车业),此案例将采用K最近邻居(K Nearest Neighbor; KNN)来建模。 案例2: 电信客户流失(电信业),此案例将采用二元罗吉斯回归(Binomial Logistic Regression)来预测客户的流失。 案例3: 药物治疗(医疗业),此案例将采用决策树 C5.0(Decision Tree C5.0) 案例4: 预 ...
已有 8 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
胖胖小龟宝 + 80 + 10 + 2 + 5 精彩帖子
reduce_fat + 77 + 2 + 4 + 4 热心帮助其他会员
statax + 20 + 2 + 2 + 1 精彩帖子
低调小武 + 1 精彩帖子
狂热的爱好者 + 3 + 5 + 3 精彩帖子
oliyiyi + 24 精彩帖子
crystal8832 + 10 + 1 + 1 精彩帖子
Oneday1 + 5 + 1 + 1 + 1 精彩帖子

总评分: 经验 + 181  论坛币 + 45  学术水平 + 12  热心指数 + 18  信用等级 + 9   查看全部评分




CDA数据分析交流群 217748971
沙发
littlelianglian 发表于 2014-11-7 08:48:01 |只看作者 |坛友微信交流群
李御玺老师将于1月1-4号,在上海进行为期4天的数据挖掘讲座。具体信息请参照:https://bbs.pinggu.org/thread-3186035-1-1.html

案例1:
评估新车设计(汽车业),此案例将采用K最近邻居(K Nearest Neighbor; KNN)来建模。
案例2:
电信客户流失(电信业),此案例将采用二元罗吉斯回归(Binomial Logistic Regression)来预测客户的流失。
案例3:
药物治疗(医疗业),此案例将采用决策树 C5.0(Decision Tree C5.0)
案例4:
预测贷款逾期者(银行业),利用贝式网络(Bayesian Network)来建模
案例5:
电信客户分类(电信业),利用多元罗吉斯回归(Multinomial Logistic Regression)
案例6:
细胞样本分类(医疗业),利用支持向量机(Support Vector Machine)来建模
案例7:
零售业销售促销(零售业),利用神经网络及回归树(Neural Network & Regression Tree)来预测未来的销售成效。
案例8:
预测带宽使用率(通讯业),利用简单的时间序列模型(Simple Time Series Model)来预测每个区域市场下三个月的带宽使用量。
案例9:
预测型录商品的销售(零售业),利用两个时间序列模型-指数平滑(Exponential Smoothing)和ARIMA
案例10:
购物篮分析(零售业),利用关联模型(Apriori)和决策树C5.0(Decision Tree C5.0)来发掘购买类似商品的客群,以及客群的特征(例如,年龄、收入、等)。
已有 1 人评分经验 学术水平 收起 理由
reduce_fat + 33 + 2 奖励积极上传好的资料

总评分: 经验 + 33  学术水平 + 2   查看全部评分

使用道具

藤椅
Oneday1 发表于 2014-11-7 08:59:51 |只看作者 |坛友微信交流群

回帖奖励 +2

哇!,感谢分享!楼主,有一个疑问:第5图是怎么看的?

使用道具

板凳
dammy00000 发表于 2014-11-7 08:59:52 |只看作者 |坛友微信交流群
學習學習 辛苦了[loveliness][loveliness]

使用道具

报纸
line_us 发表于 2014-11-7 09:04:37 |只看作者 |坛友微信交流群
好强大的样子嘛

使用道具

地板
littlelianglian 发表于 2014-11-7 09:08:28 |只看作者 |坛友微信交流群
Oneday1 发表于 2014-11-7 08:59
哇!,感谢分享!楼主,有一个疑问:第5图是怎么看的?
根据线的粗细表示药物的适合程度,线越粗,越合适。

使用道具

7
zw201488 发表于 2014-11-7 09:10:22 |只看作者 |坛友微信交流群
楼主真的好强强,我也要学习了,此时突然想说数据挖掘哪家强?

使用道具

8
sponge01 发表于 2014-11-7 10:09:29 |只看作者 |坛友微信交流群

使用道具

9
sponge01 发表于 2014-11-7 10:11:03 |只看作者 |坛友微信交流群

使用道具

10
sponge01 发表于 2014-11-7 10:50:27 |只看作者 |坛友微信交流群

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-3 14:58