楼主: jinqinglong
3412 9

[学习分享] 数据挖掘——基于R语言的实战PPT [推广有奖]

  • 1关注
  • 5粉丝

硕士生

36%

还不是VIP/贵宾

-

威望
0
论坛币
22252 个
通用积分
72.4288
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
1434 点
帖子
55
精华
0
在线时间
194 小时
注册时间
2020-11-20
最后登录
2023-4-17

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据挖掘——基于R语言的实战,感觉好建议购买正版图书,课件仅供参考
一个R语言的数据挖掘案例贯穿全书,带你全面掌握数据挖掘技术
第 一章        数据挖掘与R语言概述 7
1.1        什么是数据挖掘 7
1.2        数据挖掘的基本流程 7
1.2.1        应用背景 7
1.2.2        数据收集 8
1.2.3        数据准备 8
1.2.4        建立模型 8
1.2.5        模型评估与选择 9
1.2.6        模型监测与更新 9
1.3        关于数据挖掘项目的三个基本问题 9
1.3.1        建模数据集对预测数据集的代表性 10
1.3.2        自变量和因变量之间关系的因果性解释        11
1.3.3        模型预测精度对于实际应用的价值        12
1.4        CRISP-DM数据挖掘方法论 12
1.5        SEMMA数据挖掘方法论        13
1.6        R语言及Rstudio简介        15
第二章        数据理解        17
2.1        收集初始数据        17
2.2        描述数据        17
2.2.1        数据的精确含义 17
2.2.2        数据粒度        18
2.2.3        变量类型        18
2.2.4        冗余变量        19
2.2.5        缺省值        19
2.2.6        数据链接        19
3

4        目录
2.3        检查数据质量 19
2.3.1        抽样偏差        19
2.3.2        数据取值错误        20
2.3.3        数据缺失情况        21
2.4        初步探索数据        22
2.5        R语言分析示例:数据理解        22
第三章        数据准备        33
3.1        数据整合        33
3.2        处理分类自变量        33
3.3        处理时间信息        34
3.4        清除变量        35
3.5        异常值        35
3.6        及值        36
3.7        处理缺失数据        37
3.8        过抽样与欠抽样        38
3.9        降维        38
3.9.1        变量选择        38
3.9.2        主成分分析        39
3.10        R语言分析示例:数据整合        41
3.11        R语言分析示例:数据准备        47
第四章        关联规则挖掘        59
4.1        关联规则的基本概念及Apriori算法        59
4.1.1        关联规则的基本概念        59
4.1.2        Apriori算法简介        60
4.2        序列关联规则挖掘        60
4.3        R语言分析示例:关联规则挖掘        61
4.3.1        购物篮分析        61
4.3.2        泰坦尼克号存活情况分析        68
第五章        聚类分析        75
5.1        k均值聚类法        75
5.1.1        观测之间的距离度量        75
5.1.2        k均值聚类法的具体步骤        76

目录        5
5.1.3        关于k均值聚类法的一些点评        77
5.2        层次聚类法        78
5.2.1        层次聚类法的具体步骤        78
5.2.2        类别之间距离的度量        78
5.3        确定最优类别数        80
5.4        R语言分析示例:聚类        82
第六章        线性模型与广义线性模型        93
6.1        线性模型        93
6.1.1        模型假设与估计        93
6.1.2        模型解释        94
6.1.3        一些理论结果        94
6.1.4        模型诊断        95
6.2        广义线性模型        98
6.2.1        广义线性模型简介        98
6.2.2        因变量为二值变量或比例的情形        99
6.2.3        因变量为多种取值的名义变量的情形        100
6.2.4        因变量为定序变量的情形        100
6.2.5        因变量为计数变量的情形        101
6.2.6        因变量为取值可正可负的连续变量的情形        101
6.2.7        因变量为非负连续变量的情形        101
6.3        线性模型与广义线性模型中的变量选择        101
6.3.1        逐步回归        101
6.3.2        LASSO        102
6.4        R语言分析示例:线性模型与广义线性模型        103
6.4.1        线性模型示例        103
6.4.2        逻辑回归及Lasso示例:印第安女性糖尿病数据        107
6.4.3        逻辑回归及Lasso示例:移动运营商数据        112
第七章        神经网络的基本方法        119
7.1        神经元及神经网络介绍        119
7.1.1        单个神经元        119
7.1.2        多层感知器架构        119
7.2        神经网络模型训练        119
7.2.1        误差函数        119

6        目录
7.2.2        神经网络训练算法        119
7.3        提高神经网络模型的可推广性        119
7.4        R语言分析示例:神经网络        119
7.4.1        白葡萄酒数据        119
7.4.2        移动运营商数据        119
第八章        决策树        121
8.1        决策树简介        121
8.2        决策树的生长与修剪        121
8.2.1        一般过程        121
8.2.2        分类树        121
8.2.3        回归树        121
8.3        对缺失数据的处理        121
8.4        变量选择        121
8.5        决策树的优缺点        121
8.6        R语言分析示例:决策树        121
第九章        基千决策树的模型组合        123
9.1        基于决策树的Bagging方法        123
9.2        基于决策树的Boosting方法        123
9.3        随机森林        123
9.4        贝叶斯累加回归树(BART) 123
9.5        R语言分析示例:基于决策树的模型组合        123
第十章        模型评估与比较        125
10.1        因变量为二分变量的情形        125
10.2        因变量为多分变量的情形        125
10.3        因变量为连续变量的情形        125
10.4        R语言分析示例:模型评估与比较        125
第十一章        R语言分析案例:Kaggle房价预测数据        127
11.1        数据介绍与业务理解        127
11.2        数据理解与数据准备        127
11.3 建模        127
11.4        模型评估与比较        127
11.5        模型应用        12
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘 R语言 ppt Apriori算法 数据挖掘与r语言

Chap11_slides.pdf

244.46 KB

需要: 5 个论坛币  [购买]

Chap10_slides.pdf

905.11 KB

需要: 5 个论坛币  [购买]

Chap9_slides.pdf

549.63 KB

需要: 5 个论坛币  [购买]

Chap8_slides.pdf

699.83 KB

需要: 5 个论坛币  [购买]

Chap7_slides.pdf

784.8 KB

需要: 5 个论坛币  [购买]

Chap6_slides.pdf

1.09 MB

需要: 5 个论坛币  [购买]

Chap5_slides.pdf

1.05 MB

需要: 5 个论坛币  [购买]

Chap4_slides.pdf

765 KB

需要: 5 个论坛币  [购买]

Chap3_slides.pdf

824.19 KB

需要: 5 个论坛币  [购买]

Chap2_slides.pdf

564.42 KB

需要: 5 个论坛币  [购买]

Chap1_slides.pdf

2.79 MB

需要: 5 个论坛币  [购买]

已有 1 人评分论坛币 收起 理由
cheetahfly + 30 奖励积极上传好的资料

总评分: 论坛币 + 30   查看全部评分

沙发
tmdxyz 发表于 2020-12-31 15:14:31 |只看作者 |坛友微信交流群
接下来就是运行了,具体的就是看你自己的想要的结果是怎么样的了,我是对变量取一阶差分以后效果比较好。大家可以用这个例子来试一下具体的命令,这个命令来自经管之家的论坛。这个是链接https://bbs.pinggu.org/thread-1369942-2-1.html

webuse grunfeld, clear



. . rename company id



. . xtset id year

panel variable: id (strongly balanced)

time variable: year, 1935 to 1954

delta: 1 year



. . helm invest mvalue kstock

.

. pvar kstock invest mvalue, lag(3) gmm monte 500 "decomp 30"

运行完pvar的命令以后,你就可以得到自己想要的GMM估计结果和脉冲响应图了,是不是你想要的结果,你可以对变量进行差分调试,或者改变滞后阶数。运行出来的脉冲响应图片就是下面这样子。这里要注意的是这个图片背景没有办法直接在上面改成白色的,我问了一个老师,他说可能是写命令的作者直接把它设成了黑色。我是找同学帮忙PS的,你们看看有没有其他的办法。


大家可以参考论文《技术差距、资本深化与中国区域经济差距—来自面板数据VAR 模型的证据》和《海地区旅游产业结构优化与经济增长关系》,文章作者也是用pvar做的。至于这个原理是什么其实我也不懂,只是将自己做的过程在这里写一下。

关于命令文件大家可以去经管之家上面找,如果没有论坛币也可以把邮箱留下,我看到会发给你。很感谢经管之家给了我这么多帮助,祝大家的论文写作顺利!

使用道具

藤椅
lonestone 在职认证  发表于 2021-1-1 06:16:32 来自手机 |只看作者 |坛友微信交流群
jinqinglong 发表于 2020-12-31 01:05
数据挖掘——基于R语言的实战,感觉好建议购买正版图书,课件仅供参考
一个R语言的数据挖掘案例贯穿全书, ...
谢谢楼主分享

使用道具

板凳
weiweidada 发表于 2021-6-11 16:26:24 |只看作者 |坛友微信交流群
人民邮电https://www.ryjiaoyu.com/search?q=数据挖掘——基于R语言的实战
这里有免费的PPT(但应该需要先登录::注:如果是教师,,可以每月申请两本样书)

使用道具

报纸
weiweidada 发表于 2021-6-11 16:27:04 |只看作者 |坛友微信交流群
当然还有免费的随书代码

使用道具

地板
yunlinye 发表于 2021-6-13 22:48:33 |只看作者 |坛友微信交流群
谢谢分享

使用道具

7
Andrew__Zhang 发表于 2021-7-1 22:50:01 |只看作者 |坛友微信交流群
你好 这个PPT有课后习题的答案吗

使用道具

8
SPSSwk 发表于 2021-7-7 09:30:43 |只看作者 |坛友微信交流群
weiweidada 发表于 2021-6-11 16:27
当然还有免费的随书代码
请问有源数据吗?

使用道具

9
weiweidada 发表于 2021-7-7 22:01:05 |只看作者 |坛友微信交流群
有代码+PPT,但没有发现源数据

使用道具

10
jinqinglong 发表于 2021-7-9 17:47:52 |只看作者 |坛友微信交流群
配套数据

54278-数据挖掘——基于R语言的实战-数据文件.zip

26.79 MB

需要: 20 个论坛币  [购买]

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 16:52