楼主: 时光永痕
418 0

[数据挖掘新闻] 数据结构用例 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)四级

14%

威望
0
论坛币
26 个
通用积分
49.8622
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
317 小时
注册时间
2020-7-21
最后登录
2024-5-13

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据的数量、种类和来源都在扩大;因此,业务对按需“竞争情报”的可靠、准确和及时数据的需求也是如此。一个数据结构为应对如此复杂的数据生态系统带来的无数挑战提供了长期的技术解决方案。这个“融合平台”设计有独特的架构和一系列数据服务,能够很好地满足复杂数据生态系统的各种数据管理需求。

根据联合市场研究,到 2026 年,Data Fabric 市场预计将达到 45.469 亿美元。报告按部署、类型、企业规模和行业垂直划分的 Data Fabric 市场:2019-2026 年全球机会分析和行业预测 证实,Data Fabric 市场预计将从 2019 年到 2026 年,复合年增长率为 23.8%,到 2026 年将达到 45.469 亿美元。在此预测期间,预计北美数据结构市场将“保持主导地位”,因为云服务提供商市场是最大的采用者数据结构解决方案的数量也将在同一时期显着上升。

Data Fabric:创新的数据管理解决方案解释说,为了减轻“与不同数据类型、损坏数据、存储不足、合规性不足和网络威胁相关的风险”,数据结构提供了用于风险评估的平台工具、用于多类型数据的大型存储、单点访问跨企业的多源数据和单一数据视图。

究竟什么是 Data Fabric?
数据结构,Gartner的之一 十大数据分析趋势,被定义为:

“一种定制设计,通过以协调的方式组合数据集成方法,提供可重用的数据服务、管道、语义层或 API。”

在数字时代,多个客户接触点需要信息的顺畅流动,以进行实时分析和即时决策。诸如数据结构之类的技术框架提供了跨各种数据管道和服务平台的无缝分析过程。

在一个可靠的存储设施对于企业数据管理的成功至关重要的时代,具有充足安全性、可扩展性、复制选项和高性能特性的数据结构的“重新架构存储”似乎非常适合云基础设施即服务 (IaaS) 平台。企业数据结构有哪些不同的组件?, 产品营销高级总监 数据机 约翰·莫雷尔谈论他关于许多重要数据技术主题的视频系列,其中之一是数据结构。

最近的幻灯片有 15 家知名供应商提供大数据结构。大数据结构作为一种新兴平台,“通过从数据孤岛自动提取、管理、发现、准备和集成”来加速业务洞察。大数据结构支持“多种类型的用例,包括实时洞察、机器学习、流分析和高级分析”。

用于高级分析的大数据结构用例
在典型的大数据项目中,最大的挑战是用于分析的数据量大且复杂。Data Fabric 基础架构的敏捷性和灵活性使您能够在正确的时间快速访问正确的数据以增强分析。

正如最近的大数据用例已经毫无疑问地证实,大数据结构改变了游戏规则,如中所述 大数据结构:任何成功的大数据计划都必不可少。大数据结构平台提供端到端的安全性以及辅助数据整合为普通业务用户提供自助分析功能。文章还讨论了另一项相关技术——数据虚拟化,这对于以下方面是无价的:

访问各种数据
在没有技术技能的情况下进行大数据分析
探索不同的用例
据 Forrester 称,大数据结构是:

“通过自动、智能、安全地编排数据源,然后在 Hadoop 和 Apache Spark、数据湖、内存中和 NoSQL 等大数据平台中准备和处理它们,生成统一、可信和全面的业务数据视图。 ”

业务应用程序的 Data Fabric 用例
现代企业在边缘蓬勃发展,因此他们需要针对一系列用例实时利用技术支持的解决方案。此类用例可能是:

进行预防性维护分析以避免停机
跟进客户情绪以预测客户流失
监控市场以检测欺诈行为
进行先进的预测性和规范性分析以优化产品或流程
尽管这些用例在任何规模的企业中都很常见,但提供解决方案的技术手段和模式在整个业务领域并不相同。自认为“数据驱动”并已部署先进数据技术系统的企业可能比竞争对手更快地取得成功。

一个数据结构可能意味着此类企业的成败之间的差异,因为这个独特的数据管理生态系统提供了许多好处,例如灵活性、可扩展性、安全性、实时分析和高级分析功能——所有这些都集中在一个地方。这个Cloudera 博客文章确保大数据结构克服了“数据可用性不足、数据存储和安全性不可靠、数据孤立、可扩展性差以及对性能不佳的遗留系统的依赖等挑战”。

数据民主化和数据结构谈论数据结构中多源数据的“互操作性”,在某种程度上表明了数据的民主化。作者解释了该框架如何简化跨云和本地数据源的数据管理任务。

这MapR 数据管理例如,平台将“实时、死亡和批量”数据绑定在一起进行集体分析。MapR 数据结构使用户能够授予对现有应用程序或工具以及 Apache Drill 等新工具的访问权限。该平台支持跨“所有位置”访问“所有形式的数据”。MapR 数据结构的基本目标是打破数据孤岛,以便及时访问所有类型的数据,如中所述 现代数据结构——它对您的业务意味着什么。

这塔伦德Data Fabric Solutions 可帮助 IT 团队在项目之间切换,而无需任何学习曲线。该平台将数据集成工具、云、主数据管理 (MDM)、数据质量 (DQ) 和数据集成工具结合在一个“具有通用开发和管理环境的单一平台”上。最终目标是提高生产力。

机器学习的 Data Fabric 用例
机器学习 (ML) 模型可以在数据结构环境中有效使用,因为数据准备时间被最小化,而准备好的数据在模型和应用程序中的可用性增加。当数据在企业中分布时——在云端、本地和边缘 (IoT) 上——Data Fabric 提供“受控访问”以保护数据,从而促进增强的 ML 流程。当在正确的时间向机器学习模型提供正确的数据时,它们的学习能力会显着增强。

通常,多个模型可用于一个用例。在典型的业务分析场景中,Data Fabric 可以有效应对分布式数据堆和耗时的 ML 流程的挑战。

另一个有趣的数据结构用例是“动态数据”,必须在休息模式下访问和分析。使用全球数据结构成功进行机器学习 指出通过管理、控制数据并将数据分发给数据科学家进行高级分析,Data Fabric 平台帮助他们专注于数据分析阶段,而不是将时间浪费在数据准备上。

根据 KD Nugget 的说法:

“可重复性对于数据科学和机器学习都很重要,因此我们需要一种简单的方法,通过管理数据集目录来重用协调的结构化和非结构化数据。”

KDNugget 教程机器学习的数据结构教授图形数据库和语义数据层如何一起“集成和协调”数据结构环境中的所有数据源。

数据发现的 Data Fabric 用例
数据发现是业务分析过程中非常重要的一层,因为该层控制对正确数据的访问。当企业同时使用数据虚拟化和数据结构平台时,它们在业务分析中获得显着优势。数据发现层展示了哪些数据可供使用,类似于传统 ETL 工具的“加载”功能。使 Data Fabric 框架如此强大的是最终的数据管理层,它贯穿所有其他层并管理安全性、数据治理和 MDM。

      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据结构 Apache Spark solutions Forrester Cloudera

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-21 15:27