《对比Excel,轻松学习SQL数据分析》电子工业出版社出版,作者是张俊红。本书采用对比的方法,降低学习门槛,提高学习效率。是数据分析师的SQL实操工具书。
2、书籍目录:
入门篇
第1章数据分析基础介绍 2
1.1 数据分析是什么 2
1.2 为什么要进行数据分析 2
1.3 数据分析究竟在分析什么 5
1.4 数据分析的常规分析流程7
1.5 数据分析工具 9
知识篇
第2章数据库基础知识 12
2.1 数据库的发展及组成 12
2.2 SQL 是什么 . 13
2.3 SQL 的基本功能 . 14
2.4 SQL 查询的处理步骤 . 15
2.5 不同数据库的比较 . 16
第3章数据库工具准备 17
3.1 认识MySQL 官方网站 17
3.2 MySQL 的下载与安装 . 19
3.3 DBeaver 的下载与安装 33
3.4 DBeaver 使用说明 42
3.5 写下第一行SQL 语句 49
第4章数据源的获取 50
4.1 外部数据 . 50
4.2 公司现有数据 . 50
4.3 新建数据 . 50
4.4 熟悉数据 . 50
第5章数据的获取 54
5.1 获取列 . 54
5.2 获取想要的行 . 56
5.3 行列同时获取 . 59
5.4 插入一列固定值 . 60
5.5 JSON 列解析 . 61
5.6 对结果进行排序 . 62
第6章数据预处理 65
6.1 缺失值处理 . 65
6.2 重复值处理 . 68
6.3 数据类型转换 . 70
6.4 重命名 . 72
第7章数据运算 74
7.1 算术运算 . 74
7.2 比较运算 . 76
7.3 逻辑运算 . 78
7.4 数学运算 . 80
7.4.1 求绝对值 . 80
7.4.2 求最小整数值 . 81
7.4.3 求最大整数值 . 81
7.4.4 随机数生成 . 81
7.4.5 小数点位数调整 . 83
7.4.6 正负判断 . 83
7.5 字符串运算 . 84
7.5.1 字符串替换 . 84
7.5.2 字符串合并 . 85
7.5.3 字符串截取 . 86
7.5.4 字符串匹配 . 86
7.5.5 字符串计数 . 87
7.5.6 去除字符串空格 . 88
7.5.7 字符串重复 . 89
7.6 聚合运算 . 89
第8章控制函数 94
8.1 if函数 94
8.2 case when 函数 96
第9章日期和时间函数 99
9.1 获取当前时刻的数据 . 99
9.1.1 获取当前时刻的日期和时间 . 99
9.1.2 获取当前时刻的日期 . 99
9.1.3 获取当前时刻的时间 . 100
9.1.4 获取当前时刻所属的周数 . 101
9.1.5 获取当前时刻所属的季度 . 102
9.2 日期和时间格式转换 . 102
9.3 日期和时间运算 . 104
9.3.1 向后偏移日期和时间 . 104
9.3.2 向前偏移日期和时间 . 105
9.3.3 两个日期之间做差 . 106
9.3.4 两个日期之间的比较 . 107
第10章数据分组与数据透视表 108
10.1 group by 的底层原理 108
10.2 对分组后的数据进行聚合运算 . 109
10.3 对聚合后的数据进行条件筛选 111
10.4 group_concat函数 112
10.5 rollup. 113
10.6 数据透视表实现 115
第11章窗口函数 . 117
11.1 什么是窗口函数 117
11.2 聚合函数+over函数 117
11.3 partition by 子句 . 118
11.4 order by 子句 . 120
11.5 序列函数 . 121
第12章多表连接 127
12.1 表的横向连接 . 127
12.2 表的纵向连接 . 135
12.3 横向连接的底层原理 . 135
第13章子查询 139
13.1 子查询的概念 . 139
13.2 子查询的分类 . 139
13.3 with 建立临时表 . 144
实战篇
第14章 SQL中的其他话题 . 150
14.1 SQL 查询的执行顺序. 150
14.2 变量设置 . 152
14.3 分区表 . 153
14.4 宽表与窄表 . 154
14.5 全量表,增量表,快照表,拉链表,流水表 . 154
14.6 数据回溯 . 156
14.7 数据仓库的基本分层 . 157
14.8 SQL 语句的代码规范157
14.9 如何快速梳理数据库逻辑 159
14.10 如何快速读懂别人的代码 160
14.11 编辑器 161
14.12 创建表 167
第15章SQL 数据分析实战 170
15.1 查询每个区域的用户数 170
15.2 查询每个区域的男女用户数 171
15.3 查询姓张的用户数 171
15.4 筛选出id3~id5 的用户 172
15.5 筛选出绩效不达标的员工 172
15.6 筛选出姓张的且绩效不达标的员工 173
15.7 查询获得销售冠军超过两次的人 174
15.8 查询某部门一年的月销售额最高涨幅 175
15.9 查询每个季度绩效得分大于70 分的员工 175
15.10 删除重复值 176
15.11 行列互换 177
15.12 多列比较 178
15.13 对成绩进行分组179
15.14 周累计数据获取 180
15.15 周环比数据获取 181
15.16 查询获奖员工信息 182
15.17 计算用户留存情况 183
15.18 筛选最受欢迎的课程 185
15.19 筛选出每个年级最受欢迎的三门课程 186
15.20 求累积和 187
15.21 获取新增用户数 189
15.22 获取用户首次购买时间 190
15.23 同时获取用户和订单数据 191
15.24 随机抽样 192
15.25 获取沉默用户数 193
15.26 获取新用户的订单数 193
15.27 获取借款到期名单 194
15.28 获取即将到期的借款信息 195
15.29 获取历史逾期借款信息 196
15.30 综合实战 196
第16章 SQL中常见的报错 198
16.1 DBeaver 相关报错 198
16.2 MySQL 配置相关报错 202
16.3 语法相关报错 206