| 所在主题: | |
| 文件名: 大数据架构商业之路:从业务需求到技术方案.黄申.机械工业出版社2016.05.rar | |
| 资料下载链接地址: https://bbs.pinggu.org/a-2343859.html | |
| 附件大小: | |
|
内容简介· · · · · ·
目前大数据技术已经日趋成熟,但是业界发现与大数据相关的产品设计和研发仍然非常困难,技术、产品和商业的结合度还远远不够。这主要是因为大数据涉及范围广、技术含量高、更新换代快,门槛也比其他大多数IT行业更高。人们要么使用昂贵的商业解决方案,要么花费巨大的精力摸索。本书通过一个虚拟的互联网O2O创业故事,来逐步展开介绍创业各个阶段可能遇到的大数据课题、业务需求,以及相对应的技术方案,甚至是实践解析;让读者身临其境,一起来探寻大数据的奥秘。书中会覆盖较广泛的技术点,并提供相应的背景知识介绍,对于想进一步深入研究细节的读者,也可轻松获得继续阅读的方向和指导性建议。 作者简介· · · · · · 黄申,博士,毕业于上海交通大学计算机科学与工程专业,师从俞勇教授。微软学者,IBMExtremeBlue天才计划成员。长期专注于大数据相关的搜索、推荐、广告以及用户精准化领域。曾在微软亚洲研究院、eBay中国、沃尔玛1号店和大润发飞牛网担任要职,带队完成了若干公司级的战略项目。同时著有20多篇国际论文和10多项国际专利,兼任《计算机工程》期刊特邀审稿专家。因其对业界的卓越贡献,2015年获得美国ZF颁发的“美国杰出人才”称号。 目录· · · · · ·推荐序一 推荐序二 前言 第1章抉择 1 第2章数据收集 4 2.1互联网数据收集 4 2.1.1网络爬虫 5 2.1.2Apache Nutch简介 11 2.1.3Heritrix简介 14 2.2内部数据收集 15 2.2.1Apache Flume简介 17 2.2.2Facebook Scribe和Logstash 21 2.3本章心得 21 2.4参考资料 22 第3章数据存储 23 3.1持久化存储 23 3.1.1Hadoop和HDFS 25 3.1.2HBase简介 28 3.1.3MongoDB 35 3.2非持久化存储 37 3.2.1缓存和散列 37 3.2.2Memcached和Berkeley DB简介 41 3.2.3Redis简介 41 3.3本章心得 44 3.4参考资料 44 第4章数据处理 46 4.1离线批量处理 46 4.1.1Hadoop的MapReduce 47 4.1.2Spark简介 52 4.1.3Hive简介 53 4.1.4Pig、Impala和Spark SQL 56 4.2提升及时性:消息机制 58 4.2.1ActiveMQ简介 60 4.2.2Kafka简介 61 4.3在线实时处理 63 4.3.1Storm简介 63 4.3.2Spark Streaming简介 66 4.4本章心得 66 4.5参考资料 67 第5章信息检索 69 5.1基本理念 70 5.2相关性 70 5.2.1布尔模型 70 5.2.2基于排序的布尔模型 71 5.2.3向量空间模型 74 5.2.4语言模型 75 5.3及时性 77 5.4与数据库查询的对比 81 5.5搜索引擎 82 5.5.1Web搜索中的链接分析 83 5.5.2电子商务中的商品排序 86 5.5.3多因素和基于学习的排序 88 5.5.4系统框架 89 5.5.5Lucene简介 93 5.5.6Solr简介 98 5.5.7Elasticsearch简介 104 5.6推荐系统 108 5.6.1推荐的核心要素 109 5.6.2推荐系统的分类 110 5.6.3混合模型 115 5.6.4系统架构 116 5.6.5Mahout 116 5.7在线广告 119 5.8本章心得 127 5.9参考资料 128 第6章数据挖掘 130 6.1基本理念 131 6.2数据的表示和预处理 133 6.3机器学习算法 136 6.4挖掘工具 157 6.5本章心得 165 6.6参考资料 165 第7章效能评估 167 7.1效果评估 168 7.2性能评估 190 7.3本章心得 202 7.4参考资料 202 第8章大数据技术全景 204 第9章商品太多啦!需要搜索引擎 207 9.1业务需求 207 9.2产品设计和技术选型 208 9.3实现方案 211 第10章能否更主动?还需要推荐引擎 223 10.1业务需求 223 10.2产品设计和技术选型 225 10.3实现方案 230 第11章这样做的效果如何 241 11.1业务需求 241 11.2产品设计和技术选型 242 11.3实现方案 243 第12章这个搜索有点逊 258 12.1业务需求:还要搜得更多 258 12.2“还要搜得更多”:产品设计和技术选型 259 12.3“还要搜得更多”的方案实现 261 12.4业务需求:还要搜得更准 265 12.5“还要搜得更准”:产品设计和技术选型 266 12.6“还要搜得更准”的方案实现 271 12.7业务需求:还要更快 273 12.8还要“变”得更快:产品设计和技术选型 274 12.9还要“搜”得更快:产品设计和技术选型 275 12.10业务需求:给点提示吧 280 12.11给点提示吧:产品设计和技术选型 282 第13章支持更高效的运营 287 13.1业务需求:互联网时代的CRM 287 13.2互联网时代的CRM:产品设计和技术选型 288 13.3业务需求:抓住捣蛋鬼 291 13.4抓住捣蛋鬼:产品设计和技术选型 292 13.5业务需求:销售之战 295 13.6销售之战:产品设计和技术选型 296 后记 299 |
|
熟悉论坛请点击新手指南
|
|
| 下载说明 | |
|
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。 2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。 3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。 (如有侵权,欢迎举报) |
|
京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明