目录
序 言 2
1.1 大数据时代的挑战 12
1.2 大数据可视化的难点 12
1.3 可视化技术的新特性 13
1.4 主要数据可视化软件 14
1.4.1 Tableau 14
1.4.2 Microsoft Power BI 14
1.4.3 阿里DataV 15
1.4.4 腾讯TCV 15
1.4.5 百度Sugar 15
1.4.6 FineBI 16
1.5 Tableau软件概况 16
1.5.1 Tableau Desktop 16
1.5.2 Tableau Prep 17
1.5.3 Tableau Online 18
1.5.4 Tableau Server 19
1.5.5 Tableau Mobile 20
1.5.6 Tableau Public 20
1.5.7 Tableau Reader 20
1.6 上机操作题 20
2.1 主要新增功能 23
2.2 数据类型 24
2.2.1 主要的数据类型 24
2.2.2 更改数据类型 24
2.3 运算符及优先级 26
2.3.1 算术运算符 26
2.3.2 逻辑运算符 26
2.3.3 比较运算符 27
2.3.4 运算符优先级 27
2.4 软件安装 27
2.4.1 软件下载 28
2.4.2 安装步骤 28
2.4.3 软件激活 29
2.5 软件界面简介 31
2.5.1 开始界面 32
2.5.2 数据源界面 33
2.5.3 工作簿界面 34
2.6 文件类型 35
2.7 上机操作题 35
3.1 连接到文件 37
3.1.1 Microsoft Excel 37
3.1.2 文本文件 38
3.1.3 JSON文件 39
3.1.4 Microsoft Access 40
3.1.5 统计文件 42
3.2 连接到数据库 43
3.2.1 MySQL 43
3.2.2 SQL Server 44
3.2.3 Oracle 45
3.2.4 更多数据库 45
3.3 上机操作题 46
4.1 维度和度量 48
4.1.1 维度 48
4.1.2 度量 49
4.2 连续和离散 50
4.2.1 连续字段 50
4.2.2 离散字段 51
4.3 工作区操作 51
4.3.1 “数据”窗格 52
4.3.2 “分析”窗格 53
4.3.3 工具栏 53
4.3.4 状态栏 55
4.3.5 卡和功能区 55
4.3.6 语言和区域设置 56
4.4 工作表操作 56
4.4.1 创建工作表 56
4.4.2 复制工作表 57
4.4.3 导出工作表 57
4.4.4 删除工作表 58
4.5 基础操作案例 58
4.6 上机操作题 61
5.1 数据文件导出 63
5.1.1 复制图形中的数据 63
5.1.2 导出数据源数据 64
5.1.3 导出交叉表数据 66
5.1.4 导出Access数据 68
5.2 导出图形文件 69
5.2.1 通过复制导出 69
5.2.2 直接导出图像 71
5.3 导出PDF格式文件 73
5.4 导出PowerPoint格式文件 74
5.5 发布可视化视图 76
5.6 上机操作题 77
6.1 Hadoop简介 79
6.1.1 Hadoop分布式文件系统 79
6.1.2 MapReduce计算框架 79
6.2 连接基本条件 80
6.2.1 Hive版本 80
6.2.2 驱动程序 80
6.2.3 启动Hive服务 81
6.3 连接主要步骤 81
6.3.1 Cloudera Hadoop 81
6.3.2 Hortonworks Hadoop Hive 82
6.3.3 MapR Hadoop Hive 83
6.4 连接注意事项 83
6.4.1 日期/时间数据 83
6.4.2 已知限制 84
6.5 检验测试连接 84
6.6 上机操作题 84
7.1 提高连接性能 86
7.2 高级性能技术 88
7.2.1 “筛选器”形式的分区字段 88
7.2.2 分组字段形式的群集字段 88
7.2.3 初始化SQL 88
7.3 提升数据提取效率 89
7.3.1 存储文件格式 89
7.3.2 数据分区 89
7.3.3 数据分组 90
7.4 上机操作题 90
8.1 单变量图形 92
8.1.1 条形图 92
8.1.2 饼图 94
8.1.3 直方图 96
8.1.4 折线图 98
8.2 多变量图形 100
8.2.1 散点图 100
8.2.2 树状图 102
8.3 上机操作题 103
9.1 数字函数 105
9.2 字符串函数 107
9.3 日期函数 110
9.4 类型转换函数 112
9.5 逻辑函数 113
9.6 聚合函数 115
9.7 直通函数 116
9.8 用户函数 118
9.9 表计算函数 119
9.10 其他函数 124
9.10.1 模式匹配的特定函数 124
9.10.2 Hadoop Hive的特定函数 125
9.10.3 GoogleBigQuery的特定函数 126
9.11 上机操作题 127
10.1 表计算 129
10.2 创建字段 132
10.3 创建参数 133
10.4 聚合计算 139
10.5 缺失值处理 143
10.6 案例:超市利润额分析 144
10.7 上机操作题 147
11.1 设置角色 149
11.2 标记地图 149
11.3 添加字段信息 150
11.4 设置地图选项 151
11.5 创建分布图 155
11.6 自定义地图 155
11.7 上机操作题 156
12.1 故事简介 158
12.2 创建故事 159
12.3 设置故事格式 161
12.3.1 调整标题大小 162
12.3.2 使仪表板适合故事 162
12.3.3 设置故事格式 163
12.4 演示故事 165
12.5 上机操作题 165
13.1 Tableau Online简介 167
13.1.1 免费注册试用 167
13.1.2 创建个人站点 168
13.1.3 站点页面选项 171
13.2 Tableau Online基础操作 176
13.2.1 设置个人账户 177
13.2.2 设置显示样式 178
13.2.3 搜索相关内容 179
13.3 Tableau Online用户设置 180
13.3.1 设置站点角色 181
13.3.2 添加新的用户 182
13.3.3 创建和管理群组 185
13.4 Tableau Online项目操作 189
13.4.1 创建和管理项目 189
13.4.2 创建项目工作簿 192
13.4.2 移动项目工作簿 195
13.5 上机操作题 196
14.1 安装系统要求 198
14.2 软件安装步骤 199
14.2.1 准备安装 199
14.2.2 软件安装 200
14.2.3 在线激活 201
14.3 服务器配置 203
14.3.1 常规配置 203
14.3.2 数据连接 204
14.3.3 服务器 204
14.3.4 SMTP设置 205
14.3.5 通知和订阅 206
14.3.6 SSL 206
14.3.7 SAML 207
14.3.8 Kerberos 208
14.3.9 SAP HANA 209
14.3.10 OpenID 210
14.4 登录服务器 211
14.5 上机操作题 212
15.1 客户分析 214
15.1.1 交易次数统计 214
15.1.2 各省市利润 215
15.1.3 客户散点图 216
15.1.4 客户交易量排名 217
15.2 配送分析 218
15.2.1 配送情况 218
15.2.2 配送准时性 219
15.2.3 商品发货天数 220
15.2.4 配送延迟商品 221
15.3 销售分析 222
15.3.1 销售额统计 222
15.3.2 区域销售额 223
15.3.3 产品细分 224
15.3.4 客户细分 225
15.4 退货分析 226
15.4.1 退货区域分布 227
15.4.2 退货产品数量 228
15.4.3 退货产品类型 229
15.4.4 退货产品名称 229
15.5 预测分析 230
15.5.1 销售额预测 231
15.5.2 区域销售预测 232
15.5.3 区域利润预测 232
15.6 上机操作题 233
16.1 页面指标分析 235
16.1.1 页面访问次数 235
16.1.2 平均停留时间 236
16.1.3 区域热门页面 237
16.2 访问量分析 238
16.2.1 访问量地图 238
16.2.2 各省市访问量 240
16.2.3 访问量趋势 240
16.2.4 访问量树状图 241
16.3 浏览量分析 242
16.3.1 浏览量地图 243
16.3.2 各省市浏览量 244
16.3.3 区域浏览量 245
16.3.4 浏览量趋势 246
16.4 退出量分析 247
16.4.1 退出量地图 247
16.4.2 各省市退出量 249
16.4.3 区域退出量 249
16.4.4 退出量趋势 250
16.5 下载量分析 251
16.5.1 下载量地图 251
16.5.2 各省市下载量 252
16.5.3 区域下载量 253
16.5.4 下载量趋势 254
16.6 上机操作题 255
参考文献 259