| 所在主题: | |
| 文件名: 寻路大数据 海量数据与大规模分析.rar | |
| 资料下载链接地址: https://bbs.pinggu.org/a-2368768.html | |
| 附件大小: | |
|
【电子书免费下载】《寻路大数据》高清PDF下载 作者: Michael Manoochehri 副标题: 海量数据与大规模分析 原作名: Data Just Right: Introduction toLarge-Scale Data & Analytics 译者: 戴志伟 出版年: 2014-11
内容简介 这是一个数据爆发的时代,更是一个数据技术爆发的时代,各行各业都在因此进行深刻的变革。如何从众多的数据技术中选择正确的工具、如何使用这些工具从海量数据中挖掘出有价值的东西,无疑是非常具有挑战性的问题。 本书作者结合自己在Google 大数据平台工作的丰富经验,阐述了数据技术的方方面面。从数据收集、共享到数据存储,从分布式数据平台、分析型数据库到数据可视化,从数据工作流构建到大规模数据分析,作者不仅进行了全面而深入的介绍,更覆盖了目前流行的各种数据技术与工具,同时对技术选型提出了指导性的建议。最后,作者对数据挑战的非技术因素进行了深刻的分析,并对数据技术的发展趋势进行了展望,引人深思。 作者介绍 MichaelManoochehri 是个企业家、作家和乐观主义者。凭借自己与企业、研究机构和非营利性机构多年的合作经验,他力图让可扩展数据分析变得更加廉价和易获龋Michael 是Google 云平台开发者关系组的成员之一,关注云计算和数据开发者产品,例如Google BigQuery。此外,Michael 是技术博客ProgrammableWeb.com的作者之一,曾在乌干达农村地区研究移动电话的使用,拥有UC Berkeley 信息学院的信息管理与系统文学硕士学位。 目录 目录 第1部分 大数据时代指引 1 第1章 数据成功四原则 3 第2部分 收集和共享海量数据 13 第2章 托管和共享TB 级原始数据 15 第3章 构建基于NoSQL 的Web 应用采集众包数据 29 第4章 解决数据孤岛问题的策略 49 第3部分 数据探究 61 第5章 使用Hadoop、Hive 和Shark 探索大规模数据集 63 第6章 使用Google BigQuery 构建数据信息中心 77 第7章 探索大数据的可视化策略 93 第4部分 构建数据流水线 107 第8章 整合:MapReduce 数据流水线 109 第9章 使用Pig 和Cascading 构建数据转换工作流 127 第5部分 基于大规模数据集的机器学习141 第10章 使用Mahout 构建数据分类系统 143 第6部分 基于大规模数据集的统计分析155 第11章 使用R 语言处理大数据集 157 第12章 使用Python 和Pandas构建分析工作流 171 第7部分 展望未来 191 第13章 何时选择自制、购买或外包 193 第14章 未来:数据科技的几个趋势 205 觉得可以就回复一下吧,让更多的人看见优秀的资料!!
|
|
熟悉论坛请点击新手指南
|
|
| 下载说明 | |
|
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。 2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。 3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。 (如有侵权,欢迎举报) |
|
京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明