楼主: 时光永痕
547 0

[数据挖掘新闻] 缩小组织中的数据科学技能差距 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

46%

威望
0
论坛币
26 个
通用积分
49.7576
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
316 小时
注册时间
2020-7-21
最后登录
2024-4-24

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据科学家是市场上最受欢迎的专业人士之一。一个领英劳动力报告2018 年,在美国发现了 151,000 个数据科学家职位空缺,旧金山、洛杉矶和纽约市“严重”短缺。而且对数据科学家的需求只会越来越高。数据科学家职位的数量是预计会增长2019 年至 2029 年之间减少 15%。

由于数据科学家如此稀缺,许多公司面临着无法通过招聘来弥补的关键技能差距。这种差距的成本可能是巨大的。在数据驱动的市场中,缺乏人员来最大化大数据价值的公司在竞争中处于劣势。

由于这种短缺,许多公司正在重新构想如何执行数据科学. 通过利用数据管理平台和公民数据科学家,公司正在缩小数据科学技能差距,并释放大数据的全部潜力。

数据科学家太少——他们大部分时间都花在非专家任务上
对某人说“数据科学家”这个词,你可能会想到一个女人和男人在编造复杂的机器学习算法的形象,也许他们穿着白色的实验室外套。毕竟,许多数据科学家拥有数学、物理学、计算机科学和其他严格学科的博士学位。他们经常掌握编程语言的字母汤,从 R 到 SQL 到 Python。

通过生成模型、算法和业务洞察力,数据科学家的核心价值与这种专业知识直接相关。但是,任何数据科学家都会告诉您,在日常工作中,将不间断的时间投入到此类项目中是很困难的。大多数数据科学家花费大量时间执行死记硬背的任务,但未能充分利用他们的高级技能。

考虑数字。研究表明,数据科学家的大部分时间用于清理数据。事实上,收集和清理数据大约占数据科学家 41% 的时间,而构建和运行模型仅占 31% 左右。这是一个可悲的事实:许多数据科学家花在繁重工作上的时间比他们花在产生洞察力上的时间还要多。

这代表了问题中的问题。不仅数据科学家供不应求,而且他们还在浪费宝贵的时间来执行不需要高级技能的任务。但是通过消除这项繁重的工作,并外包其他数据科学任务,数据科学家可以专注于提供他们被聘用的有价值的见解。这就是数据管理平台和公民数据科学家的用武之地。

数据管理平台:让数据科学家专注于他们的核心使命
数据科学家从事具有不同数据集的各种项目。原始数据很少准备好进行建模或分析,因此有关清理和准备数据的统计信息。但在数据科学家甚至可以到达这个阶段之前,必须从内部和外部的各种数据源汇总数据。

数据集成阶段的低效率会影响数据科学家获得结果的时间。如果一家公司为数据源 API 手动构建数据连接器,那么数据科学家必须延迟关键项目的完成。有时,数据科学家可能不得不使用繁琐、耗时的方法手动提取数据,从而进一步占用他们宝贵的带宽。

这也是众多数据团队采用数据管理平台的原因之一。数据管理平台配备了预构建的数据连接器,通常只需单击即可从 API 源中提取原始数据。一些平台可以通过 API 按需程序或自定义 API 快速添加定制数据源。对于数据科学家来说,这些功能消除了数据集成的摩擦,因此无需等待或寻找正确的数据集。

一旦数据科学家获得原始数据,他们必须清理和准备数据以进行建模和分析。一项研究发现,数据科学家花 80% 的时间关于清理数据的不熟练的任务。将其减少到仅 40% 将使数据科学家能够将大部分时间集中在产生见解上。

近年来,增强型数据管理平台减少了数据清理等繁重的工作。增强数据管理执行数据管理的关键功能,包括摄取、存储、组织和维护数据。但 ADM 还使用机器学习和人工智能来自动提炼数据。增强数据管理执行低级任务,例如数据准备,无需人工输入。通过消除这些手动任务,增强的数据管理使数据科学家能够专注于建模和分析,从而提高生产力和效率。  

云数据仓库的兴起也促进了更有效的数据清理和准备。数据管理平台现在可以直接在云数据仓库内执行基于 SQL 的转换。此外,一些数据管理平台可以在同一个自动化工作流中摄取和转换数据。通过这种自动化的数据编排,数据科学家可以直接以他们需要的格式接收他们需要的数据,而无需费力。

随着组织更多地转向 DataOps,数据管理平台将直接向包括数据科学家在内的各个利益相关者提供数据。这种新范式将最大限度地减少数据科学家花在数据收集和准备上的时间,使他们能够专注于编码和构建模型,而不是执行不熟练的任务,从而充分利用他们的高级技能。任何人——或者更好的是,任何机器——都可以执行基本的数据管理任务。但复杂的见解必须来自数据科学家自己。通过让数据科学家专注于他们的核心任务,数据管理技术有助于缩小技能差距核心的需求问题。     

公民数据科学家:释放现有人力资本的技能
数据管理平台消除了繁重的工作并简化了数据分析,但缩小数据科学技能差距不仅仅是技术的功能。公司还将现有员工转变为“公民数据科学家”,以减少技能短缺并促进整个组织的数据科学。   

高德纳定义公民数据科学家是“创建或生成使用高级诊断分析或预测和规范能力的模型的人,但其主要工作职能不在统计和分析领域。”

通过利用包括数据管理平台在内的技术,公民数据科学家可以进行复杂的诊断分析并生成利用预测性或规范性分析的模型。这使公民数据科学家能够创建比普通业务用户更深入、更强大的分析。在缩小技能差距方面,公民数据科学家是产生先进见解的关键。

在大多数公司中,数据专业人员天生适合公民数据科学家的角色。数据分析师、BI 工程师、ETL 架构师和其他数据专家都具备执行数据科学功能的技能。但公民数据科学家也可以在数据团队之外找到。每个工人都会带来不同的技术技能。能够适应变化的人往往是该职位的最佳人选。

通过使用 AutoML 和元数据管理等工具,公民数据科学家可以为更广泛的计划或他们各自的团队生成高级分析。根据麦肯锡,只有 43% 的 B2B 销售团队有效利用高级分析。但是团队中的公民数据科学家,例如销售工程师,可以使用正确的技术部署高级分析。

随着数据科学家的短缺变得更加明显,越来越多的公司正在转向公民数据科学家来填补这一空白。以一种衡量标准,公民数据科学家现在生产更多比实际的数据科学家更先进的分析。而且这种趋势只会随着技能差距的扩大而增加。公司必须开发技术、流程和教育资源,以释放其劳动力中的公民数据科学家。   

但利用人力资本超出了公民数据科学家的范畴。即使是不精通生成分析的工作人员也可以执行基本任务,例如数据格式化和遵守数据最佳实践。数据科学技能差距需要整个组织的响应。投资于计划的公司,例如数据素养可以改进所有数据操作,包括数据科学。

公司必须利用技术和劳动力技能来缩小数据科学差距
预计经济将增加1150 万个新的数据科学职位到 2026 年,但可用数据科学工作者的数量增长速度不足以满足市场需求。技能差距是不可避免的;事实上,大多数公司已经存在技能差距。为了保持竞争力,公司必须开发一种方法来缩小差距。

这就是为什么一些公司转向数据管理平台和公民数据科学家的原因。通过这两个因素的协同工作,公司可以消除耗费数据科学家时间的机械工作,并利用现有员工开发高级分析。

这让数据科学家可以专注于产生他们被聘用的洞察力,并使公民数据科学家能够产生类似的洞察力。通过解除数据科学家的专业技能和现有员工的休眠技能,公司可以缩小数据科学技能的差距。

      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据科学 机器学习算法 python 数据科学家 计算机科学

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 22:42