楼主: 时光永痕
562 0

[数据挖掘新闻] 不惜一切代价避免的11个数据科学神话 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)四级

52%

威望
0
论坛币
26 个
通用积分
49.8622
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
317 小时
注册时间
2020-7-21
最后登录
2024-5-13

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
不惜一切代价避免的11个数据科学神话
这是数据科学神话破灭的时候!
向数据科学的过渡是艰难的,甚至是可怕的!并不是因为您需要学习数学,统计学和编程。您需要这样做,但是您还需要与周围人的神话作斗争,并找到通过他们的自己的道路!
我对这些“流行”神话有自己的看法,它们使我的生活变得困难。这是我所听到的一些:
“您需要博士学位才??能有机会成为数据科学家。两个更好!”
“参加数据科学竞赛,这将告诉您该行业的运作方式。”
“您需要大量的计算资源来构建深度学习模型。您只能在顶尖的高科技公司得到它。”
我向自己保证,一旦我看透了它们,我将通过揭穿这些神话来帮助别人。围绕着多种神话,在数据科学角色周围增加了虚假的光环。不要爱上他们!
这些神话常常使您感到只有天才才能从事数据科学工作。事实并非如此。无论您是应届毕业生,经验丰富的专业人员还是领导者,了解数据科学的工作原理并在行业中找到自己的位置都非常重要。
本文是我对这些神话的报仇!
我也做了一些聚类,??并提出了三种类型的神话:与职业有关的神话,与工具和框架有关的神话以及与数据科学角色有关的神话。阅读有关它们的信息,并确保您不喜欢它们!
如果您正在寻找在数据科学中的角色并且正在努力突破,请确保您签出了这个出色的Ascend Pro程序!这是向经验丰富的讲师学习和实际动手项目的完美融合,这是一个不可错过的机会。
您还可以查看有关业余数据科学家常犯的13个常见错误的文章。它充满了资源,所以您不想错过!
数据科学职业相关的神话
1.博士必须成为数据科学家
持有博士学位 学位是一个了不起的成就。这需要多年的努力和奉献。我对愿意付出如此努力的人们表示最大的敬意。
但是,要成为一名数据科学家,必须要攻读博士学位吗?这是一个与角色密切相关的问题。这里有几层需要剥落,所以让我们开始吧。
打破神话
为了理解这一点,让我们将数据科学家的角色大致分为两类:
应用数据科学角色
研究角色
了解这两个角色之间的区别很重要。应用数据科学主要是关于使用现有算法并了解它们如何工作。换句话说,这就是在您的项目中应用这些技术的全部。您不需要这个职位的博士学位。
大多数人都属于上述类别。您看到或听到的大多数职位空缺和职位描述都是针对这些职位的。
但是,如果您对研究角色更感兴趣怎么办?然后,是的,您可能需要博士学位。从头开始创建新算法,对其进行研究,撰写科学论文等,这些都符合博士候选人的思维定势。如果将博士学位添加到您想工作的领域,它也会有所帮助。例如,语言学博士学位对于NLP的职业将有极大帮助。
博士学位的另一个被误解的方面是机会成本。从您的角度来看,这是一个巨大的承诺-从精神上和经济上。雷切尔·托马斯(Rachel Thomas)在这里写下了这个问题,我建议您看一看。从该领域的领先研究人员那里可以得出平衡的观点。
就像雷切尔(Rachel)在她的帖子中提到的那样,有大量的数据科学先驱没有博士学位。
fast.ai联合创始人杰里米·霍华德(Jeremy Howard)
最受欢迎的“应用人工智能”书的作者Mariya Yao
CrowdAI联合创始人Devaki Raj
那么您认为自己扮演什么角色?在进入数据科学之前,这是一个至关重要的问题。
2.全职数据科学学位是过渡的必备条件
就像博士的困境一样,这是我见过有抱负的数据科学专业人士梦another以求的另一个神话。在过去几年中,随着数据科学的兴盛,您如何从竞争中脱颖而出?花费金钱来获得学位似乎是一个很好的起点。这是可以理解的反应。
这是个好消息–这是一个主要由研究机构延续的神话。
打破神话
在像数据科学这样的广阔而复杂的领域中,实践经验是至上的。您现在可以选择并从事许多项目。或者找到您热衷于解决的问题,然后看看是否可以在其中应用数据科学技术。
在线上有很多可供学习的资源。书籍,MOOC,博客,视频等。您可以下载数据科学路线图,这将为您提供有关数据科学里程碑的广泛结构。您也可以从Analytics Vidhya的学习之路开始。它是完全免费,全面的(包含上述所有资源),并为您的学习提供了一种结构-一项宝贵的功能。
由于该领域缺乏正规教育,因此过渡到数据科学归结为艰苦的工作,纪律和实践经验。这些是招聘经理要考虑的差异化因素。
OpenAI的联合创始人兼CTO Greg Brockman甚至没有大学学位!
3.您以前的所有工作经验将转化为数据科学领域
您在*某些*行业拥有5-10年的丰富经验。您是一位受人尊敬的专业人士,正在为您打电话。但是您最近迷上了数据科学,它可以为您的业务和职业做所有事情。您迫不及待想要将所有经验带入您的新领域。
听起来很熟悉?好。但是,如果您认为您的整个经历会转化为您的新角色,那么我建议您重新考虑。
打破神话
这个故事有两个方面:
您正在完全改变自己的领域以进入数据科学
您坚持以前的领域,但正在寻找数据科学的角色
让我们了解这些要点的含义。
完全更改您的域
如果您要完全改变自己的领域(例如,经过多年的软件测试后进入数据科学领域),那么您的工作经验将很可能毫无用处。您不仅要切换到全新的工作领域,而且还在寻找新的角色。当招聘人员查看您的简历时,首先想到的是–“他/她将为组织/项目带来什么价值?”。不幸的是,这种情况下的答案通常接近于零。
为什么?因为作为新手,您对该域的工作原理没有任何经验。当您获得现实世界的数据时,如果不了解这些功能如何影响最终决定,将如何使用它?
这是大多数人略过或不想面对的现实。这是完全错误的方式来改变您的职业,只会最终损害您的前景。了解情况,与进行此更改的人员交谈,并相应地调整您的期望。盲目做出如此重大的决定是失败的单向票。
留在同一个域
进入场景2 –如果您位于同一领域但转而使用数据科学,您会期望什么?然后,您的前景看起来会更好。您具有了解行业的附加优势。您应该已经了解域中存在的细微差别,因此您将了解正在使用的数据。那是一个巨大的好处。招聘经理会将其纳入最终决策。
如果可能的话,我强烈建议第二种情况。保持与您一直合作的领域,并了解如何在该领域应用数据科学。
Kunal Jain撰写的这篇文章包含许多实用技巧和窍门,可以帮助您克服在该领域缺乏经验的问题。
4.必须具备计算机科学/数学/统计/编程背景
这本质上是我们涵盖的前两个神话的延续。您将在数据科学领域遇到的大多数人都具有工程/计算机科学背景。他们将至少具有以下一个或多个领域的经验:
计算机科学
数学/量化
统计
程式设计
这是否意味着来自完全不同背景的人无法进入数据科学领域?
打破神话
绝对不!相信我,我是凭经验说话的。在过渡到数据科学之前,我花了5年时间从事学习和开发工作。可以办到。
但是,在某些情况下,您需要考虑到来自这种背景的人已经拥有了。数据科学是一个包含多个方面的细微差别领域。作为初学者,您将需要从头开始学习概念。这通常是令人沮丧的经历。您的技术同事可能会了解更多。他们可能一开始就在您前面。
这就是我们前面谈到的奉献精神和纪律特征发挥作用的地方。
例如,具有计算机科学背景的人们将已经掌握了编程的工作方式。他们可以相对轻松地在语言之间切换。另一方面,我最初在学习R方面很挣扎。在编码方面,我从左到右都不知道。但是我坚持并最终实现了突破。
没有什么暗示你也不能这样做。一旦确定了适合您的领域,就应该停下来。还在怀疑吗?然后从非技术背景的人那里查看这些鼓舞人心的故事,他们成功地完成了过渡:
迪帕克·瓦迪萨拉(Deepak Vadithala)–从纸张送货员到首席数据工程师和QlikView Luminary
我如何在10个月内成为机器学习专家的分步过程
Marios Michailidis关于非程序员的启发性故事,在Kaggle上排名第一
数据科学工具和框架相关的神话
5.学习工具足以成为数据科学家
Python或R –您应该学习哪个工具?如果每次我都得到一分钱,我都会遇到这个问题。
人们普遍认为,掌握数据科学是关于学习如何在Python或R.或任何其他工具中应用技术。该工具已成为所有其他数据科学功能发展的中心点。
假设(或神话)是,能够使用现有库(numpy,scikit-learn,caret等)编写代码应该足以将自己标记为专家。为什么工作机会还没有推出?
那真的推动了招聘经理的到来。
打破神话
数据科学需要多种技能的结合。编程不是数据科学领域的中心,它只是整体的一部分。让我们将技能范围分为两个部分:
技术素质
非技术素质或软技能
技术素质
了解某种技术的工作原理将帮助您成为一名更好的数据科学家。这就是为什么我们鼓励大家从头开始学习算法的原因。了解更改特定参数将如何影响最终模型。当您在行业中从事大型项目时,这最终将获得回报。
在利益相关者介入的情况下,错误和试验的余地很小。我们的博客上有很多文章从头开始解释机器学习和深度学习技术。仔细研究它们并尝试自己理解和复制代码。
这将是您技能集的宝贵补充。
软技能
有抱负的数据科学家经常忽略软技能。当然,任何在线课程或离线教室都不会教他们。然而,这些都是面试官所追求的品质。
解决问题的能力
结构化思维
沟通技巧
您如何掌握这些技能?遵循纪律严明的方法,并尽一切可能。以下是供您细读的一些资源:
结构化思考与分析的艺术
改善结构化思维的工具
数据科学家和分析师必不可少的:分析思维的大脑训练
20个具有挑战性的面试难题
训练您的分析思维技巧
6.深度学习需要只有顶级公司才能拥有的计算能力
深度学习似乎比我遇到的任何其他数据科学分支传播了更多的神话,包括:
DL是说机器学习的另一种方式
您需要研究背景才能开始深度学习
深度学习没有很多实际应用
但是,我所听到的最普通的神话–您需要大量的硬件来执行深度学习任务。当我第一次听说深度学习时,我想象了一个房间,里面满是由数十名数据科学家操作的IBM超级计算机。
打破神话
别误会,当深度学习模型具有强大的硬件设置来运行时,它总是会更高效地运行。但是您不需要超级计算机即可进行深度学习。在您的机器上训练模型可能需要比预期更长的时间。
如果您正在使用的数据量巨大怎么办?在本地运行它可能无法正常工作。像往常一样,谷歌对此有答案。Google Colab是一项免费的云服务,可以兼作编码笔记本。但这是最好的部分– Colab附带免费的GPU支持!
没错,您可以免费利用GPU的功能并在那里运行深度学习模型。Colab通过您的Web浏览器运行,因此您的计算机没有计算成本。深度学习爱好者还能要求什么?
以下是一些资源,可让您了解大多数人不会教的深度学习方面:
关于深度学习的12个常见问题
为什么训练深度学习模型需要GPU?
7.建成后,人工智能系统将继续自我发展和推广
好莱坞已竭尽全力以拥有人类智能的机器人的形式展示AI系统。正因为如此,像《银翼杀手》和《终结者》这样的电影成为了经典电影。他们描绘的共识是,一旦构建了AI系统,它就会继续正常工作并不断发展。
因此,一旦您建立了一个可以说是欺诈检测的模型,该模型便可以适应对其进行的任何更改。如果整个财务状况发生了变化,或者新的功能已添加到数据中,则预计该系统将继续正常运行。
打破神话
AI系统自行发展的这种状态称为人工通用人工智能(AGI)。不幸的是,我们还没有处于那种状态。差远了。
我们现在正处于狭窄阶段。我们构建的模型无法推广到其他任务,甚至无法推广到数据的重大变化。让我们以去年的GDPR政策为例。现有系统在没有人工干预的情况下会适应变化吗?我们构建的系统是否足够智能以融合道德方面?为向客户推荐产品而构建的AI系统是否可以在没有任何先前信息的情况下集成新产品?
这就是为什么在物体检测问题中为图像加标签如此重要的原因。该级别的智能尚不适用于机器。
是的,DeepMind和其他类似的高级研究机构在这方面确实取得了进展。您可能曾经听说过有关神经网络创建自己的神经网络的新闻。但是这些事态发展太少而且相去甚远。而且我们还没有弄清楚如何使它们进入商业应用。
我强烈建议您观看以下迈克尔·乔丹(Michael B. Jordan)的视频,内容涉及人工智能的现状以及我们面临的挑战。如果您可以在面试时提出来,这是一个很好的参考点。??
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:不惜一切代价 数据科学 scikit-learn Analytics Qlikview

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-4 03:57