数据分析,顾名思义,和数据打交道。简单的来讲,利用以往的数据的一些趋势或规律,对未来做出一些精准的预测。
先有数据,再有分析。
1.围绕业务,提出问题,确定需求,收集和整理数据。
2.利用整理好的数据来进行建模分析,挖掘出有价值的信息,最后可视化展示。
围绕着上述的数据分析的过程,作为一个入门小白,应该提前学习到哪些知识才能更好踏入这个行业呢。
对于前面的收集和整理部分,我们可以用到的实操工具有excel、mysql。
excel:作为一名数据分析师,对office的版本要求比较高,需要office专业增强版2016或以上,这些微软的官网都可以下载到。
下面介绍入门需要掌握的知识点:
1. excel基础技巧:
定位条件、选择性粘贴、查找与替换、视图拆分与冻结、辅助列技巧
2. 如何利用Excel进行数据收集与清洗:
批量输入数据
- 导入其他格式的数据
- 提取数据
- 数据类型转换
- 分列与合并数据
3 . excel中的常用函数: (重点、难点)
条件函数:if
条件求和函数:sumif、sumifs函数
条件计数:COUNTIF、COUNTIFS函数
数据查询:VLOOKUP函数
逆向查询:LOOKUP函数
查询好搭档:INDEX+MATCH函数
查询好搭档:INDEX+MATCH函数
计算年龄:DATEDIF函数
Mysql: 企业数据分析工作中通常需要使用数据库进行数据的存储、管理、提取和清洗
下面介绍入门需要掌握的知识点:
- 数据库的创建、使用和删除
- 数据表的创建、修改和删除
- 常用数据类型
- 数据的插入、更新和删除
- 单表查询,条件查询,空值查询,模糊查询,分组查询,连接查询 (重点)
- 比较运算符,逻辑操作符
- ER关系图的创建
- 子查询
介绍完excel和mysql的知识点之后,需要学习的就是数据分析的部分了。根据行业环境和机器语言的使用度来讲,python更多地被应用于数据分析行业。
下面介绍的就是python语言学习的知识点:
python基础:
1 基础数据类型
2 编码和标识符
3 基础数据结构:字符串、列表、字典、元组、集合 (重点)
4 控制语句:条件、循环
5 函数
6 python的IO模块
用python来数据分析常用第三方库:(重点)
1 numpy的创建,索引和切片,常用函数与方法,广播
2 pandas的创建,索引和切片,合并和连接,分组和聚合
数据分析是个跨专业的行业,不仅仅需要学习计算机的机器语言,还需要有数学的功底。数学的高数应该大多数人都学过,如果没有或者没学好也不要灰心,这里用到的数学没有考研的那么难,只需要把最基本的数学知识掌握,最后转化为机器语言呈现就行。
那么接下来就需要介绍数学该学哪些必备知识点啦:
1 微积分:
函数、微分、定积分、级数、
2 线性代数:
向量、行列式、矩阵、线性方程
3 统计:(难点、重点)
抽样分布、方差、假设检验、列联分析、相关分析、回归分析
如果掌握了以上所述的知识点的内容,等于说一只脚踏入了数据分析行业。但是以上的知识点内容难度参差不齐。
相对于excel来说,函数的使用会让操作更加简单,但是也是比较难懂的部分,这里介绍一本excel的书籍:《excel数据处理与分析实战技巧精粹》会更好的帮助理解
mysql的内容有很多,但对于数据分析人员来讲,里面的增删改查是重点,一本 :《mysql必知必会》 能很好帮助到入门的朋友们
python做为一种计算机语言,他和mysql一样有很多很强大的功能,像现在使用的google浏览器就是用python语言覆写的。但是再不同的地方所使用的内容也有所差别,针对于数据分析小白来说,《python数据科学手册》能更好的适用。
数学可能是大部分小伙伴比较头疼的问题,尤其里面的统计学部分可能是最为困难的部分,入门级别中,可以多多翻几遍大学中使用到的统计学教程,:《统计学--第六版》 --贾俊平 。看完2遍这本书,对于统计学也有个大致的了解和掌握了。