荐书:CDA数据分析系列丛书《R语言预测实战》-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 考研考博>>

考研

>>

荐书:CDA数据分析系列丛书《R语言预测实战》

荐书:CDA数据分析系列丛书《R语言预测实战》

发布:游码 | 分类:考研

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

经管之家新媒体交易平台

提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯"等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

提供微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

书名:R语言预测实战丛书名:CDA数据分析师系列丛书作者:游皓麟著出版社:电子工业出版社ISBN:978-7-121-29854-7出版年月:2016.10定价:79页数:480开本:16开字数:768本书将于2016年10月28-29日在官方微信平台“ ...
扫码加入金融交流群


书名:R语言预测实战

丛书名:CDA数据分析师系列丛书

作者:游皓麟著

出版社:电子工业出版社

ISBN :978-7-121-29854-7

出版年月:2016.10

定价:79

页数:480

开本:16开

字数:768

本书将于2016年10月28-29日在官方微信平台“经管之家论坛”进行赠书活动。



编辑推荐

本书注重算法理论与实际案例相结合,将枯燥无味的预测算法原理用R语言重现,并通过案例让读者掌握预测模型的应用。



内容提要

R语言具有上手快、效率高的特点,它横跨金融、生物、医学、互联网等多个领域,主要用于统计、建模及可视化。预测是数据挖掘的主要作用之一,也是大数据时代的核心价值所在。基于R语言来做预测,兼具效率和价值的双重属性,这是本书的一大亮点。

本书共分为三部分。第一部分讲预测基础,主要涵盖预测概念理解、预测方法论、分析方法、特征技术、模型优化及评价,读者通过这部分内容的学习,可以掌握进行预测的基本步骤和方法思路;第二部分讲预测算法,该部分包含了多元回归分析、复杂回归分析、时间序列及进阶算法,内容比较有难度,需要细心体会;第三部分讲预测案例,包括短期日负荷曲线预测和股票价格预测两个实例,读者可以了解到实施预测时需要关注的技术细节。

希望读者在看完本书后,能够将本书的精要融会贯通,进一步在工作和学习实践中提炼价值。



目录

第一部分预测入门篇

第1章预测入门 2

1.1 什么是预测 3

1.1.1预测的定义 3

1.1.2预测的特点 4

1.1.3预测的分类 4

1.1.4预测的基本原则 5

1.2 大数据与预测 7

1.2.1什么是大数据 7

1.2.2大数据预测的优势 9

1.2.3大数据预测的特征 9

1.2.4大数据预测案例 12

1.3 预测利器之R语言 22

1.3.1R语言简介 22

1.3.2R语言预测初步 33

1.3.3R语言预测常用包 42

第2章预测方法论 44

2.1 预测流程 45

2.1.1确定主题 45

2.1.2收集数据 47

2.1.3选择方法 49

2.1.4分析规律 53

2.1.5建立模型 57

2.1.6评估效果 60

2.1.7发布模型 60

2.2 指导原则 61

2.2.1界定问题 61

2.2.2判断预测法 63

2.2.3外推预测法 64

2.2.4因果预测法 66

2.3 团队构成 66

2.3.1成员分类 67

2.3.2数据氛围 68

2.3.3团队合作 70

第3章分析方法 72

3.1 相关分析 73

3.1.1自相关分析 73

3.1.2偏相关分析 74

3.1.3简单相关分析 75

3.1.4互相关分析 83

3.1.5典型相关分析 84

3.2 对应分析 88

3.3 频谱分析 92

3.4 趋势分析 94

3.5 聚类分析 96

3.5.1 K-Means算法 96

3.5.2系统聚类算法 99

3.6 关联分析 105

3.6.1关联规则挖掘:Apriori与Eclat算法 105

3.6.2序列模式挖掘:SPADE算法119

第4章特征构建技术 132

4.1 特征变换 133

4.1.1概念分层 134

4.1.2标准化 136

4.1.3离散化 139

4.1.4函数变换 142

4.1.5深入表达 143

4.2 特征组合 143

4.2.1基于特定的领域知识 143

4.2.2二元组合 144

4.2.3高阶多项式 148

4.3 自动生成:基于遗传编程的方法 152

4.3.1基本思路 153

4.3.2特征表达式 154

4.3.3产生初始种群 162

4.3.4计算适应度 163

4.3.5选择、交叉和变异 165

4.3.6实例分析 171

第5章特征选择方法 176

5.1 直接法 177

5.2 单元法 177

5.2.1 Pearson相关系数 177

5.2.2距离相关系数 179

5.2.3单因素方差分析 181

5.2.4信息增益 184

5.2.5卡方检验 191

5.2.6Gini系数 194

5.3 多元法 198

5.3.1逐步回归 198

5.3.2随机森林 203

5.3.3遗传算法 210

第6章模型参数优化 213

6.1 交叉验证 214

6.2 网格搜索 215

6.3 遗传算法 217

6.3.1基本概念 217

6.3.2遗传算法算例 218

6.3.3遗传算法实现步骤 223

6.3.4遗传算法R语言实现 223

6.3.5R语言mcga和genalg包的应用 228

6.4 粒子群优化 233

6.4.1基本概念及原理 233

6.4.2粒子群算法R语言实现 235

6.4.3粒子群算法实现步骤 238

6.4.4R语言pso包的应用 239

6.5 模拟退火 241

6.5.1基本概念及原理 241

6.5.2模拟退火算法R语言实现 242

6.5.3模拟退火算法实现步骤 244

6.5.4R语言GenSA和stats包的应用 245

第7章预测效果评估 250

7.1 概率预测评估方法 251

7.1.1混淆矩阵 251

7.1.2ROC曲线 255

7.1.3KS曲线 261

7.1.4累计收益图 263

7.1.5累计提升图 264

7.1.6累计响应图 266

7.2 数值预测评估方法 267

7.2.1常见评估指标 267

7.2.2ASD累计收益图 270

第二部分预测算法篇

第8章线性回归及其优化 274

8.1 多元线性回归 275

8.1.1回归模型和基本假定 275

8.1.2最小二乘估计 276

8.1.3回归方程和回归系数的显著性检验 276

8.1.4多重共线性 277

8.2  Ridge回归280

8.2.1基本概念 281

8.2.2岭迹曲线 281

8.2.3基于GCV准则确定岭参数 283

8.2.4Ridge回归的R语言实现 284

8.3  Lasso回归 285

8.3.1基本概念 285

8.3.2使用LAR求解Lasso 286

8.3.3Lasso算法的R语言实现288

8.3.4R语言lars包的应用 290

8.4 分位数回归 292

8.4.1基本概念 292

8.4.2分位数回归的计算 294

8.4.3用单纯形法求解分位数回归及R语言实现 296

8.4.4R语言quantreg包的应用 298

8.5 稳健回归 300

8.5.1基本概念 301

8.5.2M-估计法及其R语言实现 301

8.5.3应用R语言MASS包实现稳健回归 304

第9章复杂回归分析 307

9.1 梯度提升回归树(GBRT) 308

9.1.1 Boosting方法简介 308

9.1.2 AdaBoost算法 308

9.1.3提升回归树算法 311

9.1.4梯度提升 312

9.1.5GBRT的R语言实现 314

9.1.6R语言gbm包的应用 316

9.2 神经网络 320

9.2.1基本概念 320

9.2.2单层感知器学习算法 322

9.2.3SLP回归算法的R语言实现 323

9.2.4BP神经网络学习算法 325

9.2.5BP回归算法的R语言实现 327

9.2.6RBF神经网络学习算法 330

9.2.7RBF回归算法的R语言实现 332

9.2.8Elman神经网络学习算法 334

9.2.9Elman回归算法的R语言实现 336

9.2.10使用R语言包构建神经网络 338

9.3 支持向量机回归 343

9.3.1基本问题 344

9.3.2 LS-SVMR算法347

9.3.3 LS-SVMR算法的R语言实现 348

9.4 高斯过程回归 349

9.4.1GPR算法 350

9.4.2GPR算法的R语言实现 352

9.4.3R语言kernlab包的应用355

第10章时间序列分析 358

10.1  Box-Jenkins方法 359

10.1.1p阶自回归模型 359

10.1.2q阶移动平均模型 361

10.1.3自回归移动平均模型 363

10.1.4 ARIMA模型 365

10.1.5 ARIMA模型的R语言实现 367

10.1.6R语言forecast包的应用 373

10.2 门限自回归模型 376

10.2.1TAR模型的基本原理 376

10.2.2TAR模型的R语言实现 377

10.2.3R语言TSA包的应用 380

10.3  GARCH模型族 382

10.3.1线性ARCH模型 382

10.3.2 GRACH模型 383

10.3.3 EGARCH模型 384

10.3.4 Power ARCH模型 384

10.3.5 PARCH模型的R语言实现 385

10.3.6R语言fGarch包的应用 395

10.4 向量自回归模型 398

10.4.1VAR模型基本原理 398

10.4.2VAR模型的R语言实现 399

10.4.3R语言vars包的应用 403

10.5 卡尔曼滤波器算法 405

10.5.1 Kalman滤波算法初步 406

10.5.2 Kalman滤波的R语言实现 407

10.5.3R语言FKF包的应用 409

第三部分预测应用篇

第11章短期日负荷曲线预测414

11.1 电力行业负荷预测介绍 415

11.2 短期日负荷曲线预测的基本要求 415

11.3 预测建模准备 416

11.3.1基础数据采集416

11.3.2缺失数据处理及平滑 418

11.3.3潜在规律分析421

11.4 基于RBF神经网络的预测 426

11.4.1RBF网络结构设计426

11.4.2确定最优参数427

11.4.3建模并实现预测 431

11.4.4效果评估433

11.5 基于LS-SVMR算法的预测 435

11.5.1确定最优参数436

11.5.2建模并实现预测 438

11.5.3效果评估439

第12章股票价格预测 442

12.1 股票市场简介 443

12.1.1股票的基本概念 443

12.1.2股票市场常用术语443

12.1.3股价波动的影响因素 447

12.2 获取股票数据 452

12.3 基于VAR算法的预测 455

12.3.1平稳性检验 455

12.3.2VAR模型定阶 456

12.3.3预测及效果验证 457

参考文献 459


媒体评论

本书对基于R语言的预测进行了非常深入和全面的讲解,从理论到算法,从应用到案例。本书从入门级开始逐渐深入,适合不同阶段和层次的读者,深入浅出,通俗易懂,是一本难得的好书。

--李成华,飔拓科技董事长兼CTO,曾任京东DNN实验室首席科学家

R语言是一种功能强大且免费开源的语言,目前市场上以讲解R语言工具、统计、数据挖掘、数据分析的居多,系统地讲解预测专题的很少,本书涵盖方法、理论、实战,非常适合从事预测、机器学习的朋友阅读。

——张旋,乐视体育CTO

一本数据实战工作者真正需要的书,作者直指预测这一最具挑战性的主题,用丰富的经验和优美的语言如抽丝剥茧般说清楚了很多问题,非常不错。

——李舰中科九峰智慧医疗 CTO



作者简介

游皓麟,高级数据分析师,目前专注于NLP、知识图谱以及深度学习的研究与实现。曾服务于华为技术软件有限公司等企业,多次出席R语言会议并发表演讲,在小象学院担任过R语言数据挖掘和机器学习讲师。


「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-4905150-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
经管之家 人大经济论坛 大学 专业 手机版