| 所在主题: | |
| 文件名: 大数据时代的算法:机器学习、人工智能及其典型实例.rar | |
| 资料下载链接地址: https://bbs.pinggu.org/a-2468342.html | |
| 附件大小: | |
|
【电子书免费下载】《大数据时代的算法》高清PDF下载 作者: 刘凡平 副标题: 机器学习、人工智能及其典型实例 出版年: 2017-1
内容简介 《大数据时代的算法:机器学习、人工智能及其典型实例》介绍在互联网行业中经常涉及的算法,包括排序算法、查找算法、资源分配算法、路径分析算法、相似度分析算法,以及与机器学习相关的算法,包括数据分类算法、聚类算法、预测与估算算法、决策算法、关联规则分析算法及推荐算法。《大数据时代的算法:机器学习、人工智能及其典型实例》涉及的相关算法均为解决实际问题中的主流算法,对于工作和学习都有实际参考意义。 《大数据时代的算法:机器学习、人工智能及其典型实例》是一本算法领域内的技术参考书籍,涵盖数十种算法,通过由浅入深的介绍基础算法和机器学习算法相关理论和应用,阐述了各个算法的应用场景及算法复杂度,使读者对算法的理解不只是停留在表面,还从应用的角度提供了大量实例,使读者能够快速、高效进阶各类算法,并能够熟练应用到将来的工作实践中。
目录 第1章算法基础 11.1基础算法分析类型 1 1.1.1分治法 1 1.1.2动态规划法 2 1.1.3回溯法 3 1.1.4分支限界法 4 1.1.5贪心法 4 1.2算法性能分析 5 1.3概率论与数理统计基础 6 1.4距离计算 8 1.4.1 欧氏距离 8 1.4.2 马氏距离 9 1.4.3 曼哈顿距离9 1.4.4 切比雪夫距离 9 1.4.5 闵氏距离 9 1.4.6 海明距离 10 1.5排序算法 10 1.5.1快速排序 11 1.5.2归并排序 11 1.5.3堆排序 13 1.5.4基数排序 15 1.5.5外排序 16 1.6字符压缩编码 17 1.6.1哈夫曼编码 17 1.6.2香农-范诺编码21 1.7本章小结 24 第2章数据查找与资源分配算法 25 2.1数值查找算法 25 2.1.1二分搜索算法 25 2.1.2分块查找算法 27 2.1.3哈希查找算法 28 2.2字符串查找算法 30 2.2.1Knuth-Morris-Pratt算法31 2.2.2Boyer-Moore算法 34 2.2.3Sunday算法 37 2.3海量数据中的查找 39 2.3.1基于布隆过滤器查找 39 2.3.2倒排索引查找 41 2.4银行家算法 43 2.5背包问题 44 2.5.10-1背包问题 45 2.5.2部分背包问题 46 2.6本章小结 47 第3章路径分析算法 49 3.1基于Dijkstra算法的路径分析 49 3.1.1应用示例:极地探险 49 3.1.2基于Dijkstra的最短路径规划 50 3.2基于Floyd算法的路径分析 53 3.2.1应用示例:任意两个城市之间的最短路径 53 3.2.2Floyd原理54 3.2.3基于Floyd算法计算两个城市最短距离 56 3.3基于A*算法的路径搜索 58 3.3.1应用实例:绕过障碍区到达目的地 58 3.3.2A*算法与最短距离计算 59 3.4基于维特比算法的概率路径 61 3.4.1应用实例:推断天气状态 61 3.4.2维特比算法思想 62 3.4.3计算天气状态 62 3.5最长公共子序列问题 64 3.5.1概要 64 3.5.2最长公共子串 64 3.5.3最长公共子序列原理 66 3.5.4实例:求两字符串的最长公共子序列 66 3.6本章小结 68 第4章相似度分析算法 69 4.1应用实例:海量网页相似度分析 69 4.2基于Jaccard相似系数的相似度计算 70 4.2.1计算流程 70 4.2.2狭义Jaccard相似系数 71 4.2.3广义Jaccard相似系数 71 4.3基于MinHash的相似性算法 71 4.3.1与Jaccard相似性关系 71 4.3.2计算网页文本相似性过程 72 4.4向量空间模型 73 4.4.1词袋模型 73 4.4.2TF-IDF算法 74 4.5基于余弦相似性算法的相似度分析 76 4.5.1原理基础 76 4.5.2公式解析 77 4.5.3计算网页文本相似性过程 77 4.6基于语义主题模型的相似度算法 78 4.7基于SimHash算法的指纹码 80 4.7.1SimHash引入 81 4.7.2SimHash的计算流程 81 4.7.3计算重复信息 83 4.8相似度算法的差异性 84 4.9本章小结 85 第5章数据分类算法 86 5.1基于朴素贝叶斯分类器 86 5.1.1有监督分类与无监督分类 87 5.1.2应用实例:识别车厘子与樱桃 88 5.1.3分类流程归纳 91 5.1.4应用扩展:垃圾邮件识别 92 5.1.5常用评价指标 96 5.2基于AdaBoost分类器 100 5.2.1AdaBoost概述100 5.2.2AdaBoost算法具体流程101 5.2.3AdaBoost算法的应用实例 102 5.2.4AdaBoost算法的优点 105 5.3基于支持向量机的分类器 105 5.3.1线性可分与线性不可分 106 5.3.2感知器 107 5.3.3支持向量机 108 5.4基于K邻近算法的分类器 109 5.4.1应用实例:电影观众兴趣发现 109 5.4.2核心思想 109 5.4.3电影观众兴趣发现 110 5.5本章小结 113 第6章数据聚类算法 115 6.1基于系统聚类法 115 6.1.1概述 116 6.1.2最短距离法 117 6.1.3重心聚类法 119 6.1.4动态聚类法 120 6.2基于K-Means聚类算法 122 6.2.1应用实例:新闻聚类 122 6.2.2逻辑流程 123 6.2.3实现新闻聚类分析 124 6.2.4K-Means++ 128 6.2.5K-中心点聚类算法 129 6.2.6ISODATA聚类算法 130 6.3基于密度的DBSCAN算法131 6.4基于BIRCH算法的聚类分析 133 6.4.1聚类特征 133 6.4.2聚类特征树 134 6.5聚类与分类差异 135 6.6本章小结 136 第7章数据预测与估算算法 137 7.1产生式模型与判别式模型 137 7.2基于最大似然估计的预测 138 7.3基于线性回归的估算 140 7.3.1概要 140 7.3.2最小二乘法 141 7.4基于最大期望算法分析 143 7.5基于隐马尔科夫模型预测 144 7.5.1应用实例:高温天气与行为概率 144 7.5.2原理分析 145 7.5.3高温天气与行为概率 147 7.6基于条件随机场的序列预测 151 7.6.1应用实例 151 7.6.2原理分析 151 7.6.3条件随机场的优缺点 153 7.7本章小结 154 第8章数据决策分析算法 155 8.1基于ID3算法的决策分析 156 8.1.1信息量 156 8.1.2信息熵 156 8.1.3信息增益 157 8.1.4ID3算法流程 157 8.1.5ID3算法的应用 157 8.2基于C4.5算法的分类决策树 159 8.2.1概要 159 8.2.2应用实例 159 8.3基于分类回归树的决策划分 161 8.3.1概要 162 8.3.2应用实例:决策划分 163 8.3.3剪枝 164 8.4基于随机森林的决策分类 168 8.4.1随机森林的特点 169 8.4.2随机森林的构造方法 169 8.4.3应用实例:决定车厘子的售价层次 170 8.5本章小结 172 第9章数据关联规则分析算法 174 9.1基于Apriori算法的关联项分析 174 9.1.1应用实例:超市的货架摆放问题 175 9.1.2基本概要 175 9.1.3算法原理 176 9.1.4有效摆放货架 176 9.2基于FP-Growth算法的关联性分析179 9.2.1构建FP树179 9.2.2频繁项分析 181 9.2.3与Apripri算法比较184 9.3基于Eclat算法的频繁项集挖掘 184 9.4本章小结 185 第10章数据推荐算法 187 10.1概要 187 10.1.1推荐算法发展188 10.1.2协同过滤推荐189 10.2基于Item-Based协同过滤推荐 190 10.2.1Item-Based基本思想 190 10.2.2Slope One实例:基于评分推荐 190 10.3基于User-Based协同过滤推荐 193 10.3.1应用实例:根据人群的推荐194 10.3.2User-Based与Item-Based对比 197 10.4基于潜在因子算法的推荐 198 10.4.1应用实例:新闻推荐 198 10.4.2流行度与推荐200 10.5推荐算法与效果评价 201 10.6本章小结 203 觉得可以就回复一下吧,让更多的人看见优秀的资料!! |
|
熟悉论坛请点击新手指南
|
|
| 下载说明 | |
|
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。 2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。 3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。 (如有侵权,欢迎举报) |
|
京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明