楼主: 时光永痕
397 0

[数据挖掘新闻] 数据治理和数据科学:什么是交叉点? [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

54%

威望
0
论坛币
26 个
通用积分
49.7576
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
316 小时
注册时间
2020-7-21
最后登录
2024-4-28

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
随着对数据科学中数据操纵和统计方法滥用的担忧日益增加,必须制定强有力的数据治理政策和实践来遏制数据的退化和用于实现数据驱动的科学方法结论。

数据治理(DG)有望在未来发挥关键作用数据科学(DS) 实践,因为它在数据分析过程之前、期间和之后的多个点提供分阶段的有效性检查,以防止数据滥用和应用腐败的科学方法。

这个福布斯刊物指出数据科学“已经变成了为已经做出的决定提供虚假的可信度”。这意味着在前数据科学时代,行业领导者在没有数据分析的帮助下做出了同样出色的商业决策,并表明数据科学提供了一个“科学拐杖”来证明这些决策的合理性。

福布斯帖子的另一个含义是,决策者可能会根据滥用的统计和研究方法做出决定。这意味着数据由人脑有意识地操纵,以满足业务决策者的特定需求。这就是数据治理发挥关键作用的地方,通过制衡确保数据科学中的数据不会被操纵。同样令人担忧的是,频繁的数据泄露会危及所有后续数据相关活动。

危险品政策和程序通常与企业中使用的数据的可用性、完整性、安全性和可用性有关。因此,DG 原则和实践对于所有业务流程功能都至关重要,例如合规性、遗留升级、并购活动、商业智能系统、风险管理、数据湖或数据仓库。数据治理与数据质量:管理数据驱动的解决方案认为数据质量与数据治理重叠。这篇文章着眼于 DG 和 DS 之间的交点。每个数据科学家都需要了解的有关数据治理的知识建议无论企业中的个人角色如何,数据专家都将熟悉处理数据资产的基本最低礼仪。

数据科学与数据治理的第一个交集点:大数据来拯救

大数据通常驻留在移动、社交、云或物联网设备上,这些设备在高速数据传输过程中会自然而然地失去一些完整性。此外,数据管道并非没有安全和隐私威胁。在数据传输过程中发生了重大的数据泄露事件。因此,企业必须将数据安全作为所有数据驱动实践的重中之重。

白皮书名为大数据、数据治理和 MDM 的交集,查看大数据分析、数据治理和 MDM 在社会治理(治理来自社交渠道的数据)中的交集。

在大数据分析中,DG 与 DS 交叉路径在以下倡议期间:

维护法规遵从性,例如欧盟通用数据保护条例 (GDPR)。
多结构化数据的质量检查。
在信息治理 (IG) 期间,包括创建“政策、流程和控制”以管理端到端价值链中的企业数据。
分析时代:在数据驱动的世界中竞争表明在过去五年中,各种数据类型的快速增长,以及机器学习 (ML) 和深度学习 (DL) 算法的预测能力大大提高,将大数据分析带到了业务活动的最前沿。目前,没有竞争企业可以考虑将业务目标与数据分析目标分开。

在接下来的五年中,企业将更加依赖数据和分析来做出关键的日常决策并规划未来的行动;因此,数据和分析(破坏性技术)的可信度是最受关注的。虽然先进的算法有望解决跨行业的广泛业务问题,但除非数据和分析实践具有最高质量,否则这些承诺在很大程度上仍未实现。

未来,更多的处理能力和更多的数据将增加神经网络和强化学习带来的好处。然而,未来的数据宝库必须由可靠的政策和实践来管理,以提供预期的收益。

DG 和 DS 之间的第二个交集点:数据治理本身是一个不断扩大的细分市场

在数据科学领域,数据治理的重要性将继续增长,市场新闻就证明了这一点。您对数据治理的选择越来越多表明多样化的数据治理平台和解决方案正越来越多地涌入市场。这些平台包括用于策略执行、策略监控、数据治理管理和数据发现技术的复杂解决方案。DG 解决方案的最终目标是将数据保持在最高质量水平,同时管理主数据或整个信息生命周期。

随着数据泄露丑闻的增加,例如与 FB 或 Cambridge Analytica 相关的丑闻,数据所有权、使用责任和数据保护在商业走廊中变得越来越重要。

Breachlevelindex 报告称,每天丢失“500 万条数据记录”,相当于“每秒丢失 60 条记录”。这一惊人的统计数据表明,必须在数据驱动的活动中实施干净和诚实的行为实践。这构成了核心数据伦理. 数据伦理:新的数据治理挑战在 DG 中解释了这个新概念。本文对数据处理的重要方面进行了全面讨论,例如所有权、责任、安全、隐私、机密性、知情同意等。

DG 和 DS 之间的第三交点:建立道德模型

为什么数据治理会导致数据驱动的成功描述了 DG 如何在数据驱动的分析时代为管理企业数据资产创造价值。在数据质量和集成推动数据驱动洞察成功的环境中,高级数据模型和算法仅与“它们所应用的数据”一样好。如果没有出色的数据,即使是最好的模型和算法也无法提供结果。

数据科学治理表明治理数据科学家的角色将是确保预测模型的数据得到正确验证的组成部分。

DG 和 DS 之间的第四个交点:数据湖

作为其中之一2019 年的 5 项预测:来自数据的商业价值, Forrester Research 已确定采用“数据结构技术”与数据湖。认真考虑从技术投资中获取最大价值的企业正在使用数据湖. 正如 Forrester 所观察到的,在 2019 年,添加 Data Fabric 技术将确保自动化数据治理和部署与扩展数据相关的策略。借助这些技术,数据服务提供商将能够向其客户授予对广泛数据源的访问权限。

DS 和 DG 之间的第五个交叉点:首席数据官

在数据民主时代,首席数据官(CDO) 是推动企业中公民数据科学家的努力和举措的新领导者。随着自助服务数据分析平台在组织中的增长和普及,数据驱动活动的民主力量正在逐渐浮出水面。

在不久的将来,缺乏高素质的数据科学家将不会像最初想象的那样是一个挑战。现在,借助 ML 和 DL 等先进技术,自动化和半自动化数据分析平台将使普通业务用户无需 IT 团队的帮助和支持即可完成日常工作。

CDO 将从前线推动这一进程,并确保公民数据科学家的所有民主权利得到保护。在这个时代,数据治理实际上是关于治理人,并指导他们进行适当的数据处理行为。最后说明


数据治理的未来:平衡数据治理和数据管理 当公民商业用户将有权做出重要决策时,我们会放眼未来,并以管理得当的技术为后盾。那一天指日可待。


      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据科学 交叉点 Forrester CDA LEVEL Cambridge

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 21:48