请选择 进入手机版 | 继续访问电脑版
楼主: xmwang492
43117 149

[数据挖掘书籍] [下载]Data Mining with R(一本正宗pdf的数据挖掘好书)   [推广有奖]

  • 0关注
  • 0粉丝

大成

大专生

78%

还不是VIP/贵宾

-

威望
0
论坛币
4013 个
通用积分
0.0600
学术水平
2 点
热心指数
4 点
信用等级
2 点
经验
805 点
帖子
45
精华
0
在线时间
72 小时
注册时间
2006-1-5
最后登录
2022-1-14

xmwang492 发表于 2008-1-13 23:40:00 |显示全部楼层 |坛友微信交流群
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

data mining[usemoney=10]  188152.pdf (1.68 MB)

[usemoney] 

Contents
Preface iii
1 Introduction 1
1.1 How to read this book? . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 A short introduction to R . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Starting with R . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2 R objects . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.3 Vectors . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.4 Vectorization . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.5 Factors . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.6 Generating sequences . . . . . . . . . . . . . . . . . . . . 11
1.2.7 Indexing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.8 Matrices and arrays . . . . . . . . . . . . . . . . . . . . . 14
1.2.9 Lists . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.2.10 Data frames . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.2.11 Some useful functions . . . . . . . . . . . . . . . . . . . . 23
1.2.12 Creating new functions . . . . . . . . . . . . . . . . . . . 25
1.2.13 Managing your sessions . . . . . . . . . . . . . . . . . . . 28
1.3 A short introduction to MySQL . . . . . . . . . . . . . . . . . . . 29
2 Predicting Algae Blooms 33
2.1 Problem description and objectives . . . . . . . . . . . . . . . . . 33
2.2 Data Description . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3 Loading the data into R . . . . . . . . . . . . . . . . . . . . . . . 34
2.4 Data Visualization and Summarization . . . . . . . . . . . . . . . 35
2.5 Unknown values . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.5.1 Removing the observations with unknown values . . . . . 43
2.5.2 Filling in the unknowns with the most frequent values . . 44
2.5.3 Filling in the unknown values by exploring correlations . 45
2.5.4 Filling in the unknown values by exploring similarities
between cases . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.6 Obtaining prediction models . . . . . . . . . . . . . . . . . . . . . 52
2.6.1 Multiple linear regression . . . . . . . . . . . . . . . . . . 52
2.6.2 Regression trees . . . . . . . . . . . . . . . . . . . . . . . 58
2.7 Model evaluation and selection . . . . . . . . . . . . . . . . . . . 64
2.8 Predictions for the 7 algae . . . . . . . . . . . . . . . . . . . . . . 70
2.8.1 Preparing the test data . . . . . . . . . . . . . . . . . . . 71
2.8.2 Comparing the alternative models . . . . . . . . . . . . . 71
2.8.3 Obtaining the prediction for the test samples . . . . . . . 74
2.9 Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3 Predicting Stock Market Returns 79
3.1 Problem description and objectives . . . . . . . . . . . . . . . . . 79
3.2 The available data . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.2.1 Reading the data from the CSV file . . . . . . . . . . . . 81
3.2.2 Reading the data from a MySQL database . . . . . . . . . 82
3.2.3 Getting the data from the Web . . . . . . . . . . . . . . . 85
3.3 Time series predictions . . . . . . . . . . . . . . . . . . . . . . . . 87
3.3.1 Obtaining time series prediction models . . . . . . . . . . 90
3.3.2 Evaluating time series models . . . . . . . . . . . . . . . . 96
3.3.3 Model selection . . . . . . . . . . . . . . . . . . . . . . . . 100
3.4 From predictions into trading actions . . . . . . . . . . . . . . . . 103
3.4.1 Evaluating trading signals . . . . . . . . . . . . . . . . . . 104
3.4.2 A simulated trader . . . . . . . . . . . . . . . . . . . . . . 106
3.5 Going back to data selection . . . . . . . . . . . . . . . . . . . . . 110
3.5.1 Enriching the set of predictor variables . . . . . . . . . . . 110
Bibliography 119
(DRAFT - May 22, 2003)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Data Mining With 数据挖掘 ning Data PDF 好书 Mining Data 正宗

已有 4 人评分经验 学术水平 热心指数 信用等级 收起 理由
残阳_等待 + 100 精彩帖子
clh7140 + 1 + 1 对论坛有贡献
lucy430022 + 1 对论坛有贡献
bluebluestar + 1 + 1 + 1 精彩帖子

总评分: 经验 + 100  学术水平 + 1  热心指数 + 3  信用等级 + 2   查看全部评分

本帖被以下文库推荐

thank you

使用道具

jianjun-wu 发表于 2009-3-24 10:42:00 |显示全部楼层 |坛友微信交流群
Thanks !!!

使用道具

finger_seven 发表于 2009-3-24 14:35:00 |显示全部楼层 |坛友微信交流群

谢谢

使用道具

oneforall 发表于 2009-3-27 08:51:00 |显示全部楼层 |坛友微信交流群
Good, thanks!

使用道具

aijundang 发表于 2009-3-27 14:16:00 |显示全部楼层 |坛友微信交流群
感谢分享!楼主好人啊!

使用道具

dylan_c 发表于 2009-6-6 09:02:00 |显示全部楼层 |坛友微信交流群
狂顶~~~~~~~~~~~~~~~~

使用道具

qffq 发表于 2009-6-12 03:53:00 |显示全部楼层 |坛友微信交流群
Thanks a lot!

使用道具

sageding 发表于 2009-6-15 23:50:15 |显示全部楼层 |坛友微信交流群
呵呵,不错

使用道具

xiaowenzi22 发表于 2009-6-16 00:40:05 |显示全部楼层 |坛友微信交流群
小蚊子乐园:http://blog.sina.com.cn/m/xiaowenzi22

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 10:09