5个学习数据分析的正确方法_数据分析
对于初步入数据分析这个行业,看着一堆资料的同学来说这无疑是枯燥无味的,很难进行系统有效的学习,其实有些人可以通过书来很好的学习,但是我认为最好的学习方法是通过实践,知道自己真的需要学习什么,最重要的是,当你通过这种方式学习,你可以获得立刻就可以用到的技能。这也是我和很多初学者分享的观点。
这就是为什么我不认为你的第一个目标应该是学习线性代数或是统计。如果你想学习大数据,你的第一个目标应该是学会爱数据。
1、学会爱数据
没有人谈论在学习动机。 数据科学是一个广泛而模糊的领域,这使得它很难学习。 没有动力,你最终会中途停止对自己失去信心。
你需要些东西来激励你不断学习,即使是在半夜公式已经开始变的模糊,你还是想探究关于神经网络的意义。你需要些动力来让你发现统计、线性代数和神经网络之间的联系,当你在困惑“下一步我该学习什么?”的时候。
我学习的入口是用数据来预测股市,尽管当时我完全不熟悉。我编码的第一批项目用于预测股票几乎没有统计,但是我知道它们表现的并不好,所以我日以继夜的工作让它们变的更好。
我痴迷于改善程序的性能,我痴迷于股票市场,我学习去爱数据。我去学习一切能让这个项目结果更好的技能。
并不是每个人都会痴迷于股市预测,但重要的是要发现你想学习的东西。
数据可以计算出关于你的城市很多新鲜有趣的事情,比如所有设备在互联网上的映射、找到真正的NBA球员的位置,今年又哪些地方有难民,或者是其他事情。数据科学的伟大之处是有无限有趣的东西可以发现——那就是问问题然后找到一个方法来得到答案。
2、在实践中学习
学习神经网络、图像识别和其他尖端技术是很重要的,但大多数数据科学工作不涉及这些:
90%的工作将是数据清理。
精通几个算法比知道一点许多算法要好。
如果你知道线性回归、k – means聚类和逻辑回归,可以解释和诠释他们的研究结果,并可以用这些完成一个项目,你将比如果你知道每一个演算法,但不使用它们更优秀。
大多数时候,当你使用一种算法,它将是库中的一个版本(你很少会自己编码支持向量机实现——这需要太长时间)。
所有这些意味着最好的学习方法是在项目工作中学习,通过项目,你可以获得有用的技能。
一种方法是在一个项目中先找到一个你喜欢的数据集,回答一个有趣的问题。