数据需求是上下文相关的,并且基于用户的角色。营销部门希望从用例的角度了解客户,以更好地定位潜在客户。财务部门想知道产品保修是否得到满足。销售部门想要确定如何向现有客户销售更多产品。“每个人都希望对同一实体有不同的看法,并跨越多个不同的因素,”说拉维·尚卡尔, 数据虚拟化公司高级副总裁兼首席营销官德诺多。Shankar 与 DATAVERSITYò 就当今组织的数据管理和数据虚拟化之间的互连和挑战进行了交谈。
数据管理汇集来自不同来源的所有数据,并创建该信息的可信视图,实时提供给业务,以便在业务运行和收集数据时,立即可供业务用户使用。
但是,随着数据的传入,并非所有数据都需要对所有用户开放。由于对数据使用的监管限制,公司可能希望能够审计数据并控制对敏感信息的访问,以及保护生产源。“任何公司的数据受益者都是业务用户。对他们来说,数据需要可靠、即时可用且安全,”他说。
对抗重力
数据整合从多个不同的存储系统收集数据,并将其提供给消费系统。Shankar 评论说,提取、转换和加载 (ETL) 是一种将数据批量化并从操作系统移动到数据仓库的方法。
Shankar说,类似于ETL的其他形式的数据集成将来自不同来源的数据收集到一个中央存储库中,该存储库复制数据。“它给数据消费者和许多其他问题带来了延迟,”特别是在医疗保健等行业,延迟可能会产生严重影响。
在当今海量数据存储的背景下,这些旧工具一直在与“数据引力”(由戴夫麦克罗里),它将数据与具有足够质量以施加引力的行星或其他物体进行比较。尚卡尔 说:
“随着数据的积累(积累),这些数据更有可能吸引更多的服务和应用程序。这与重力对行星周围物体的影响相同。随着质量或密度的增加,引力的强度也会增加。如果足够大,数据几乎不可能移动。”
Will Ochandarena 在一篇题为前沿:Data Fabric、无人驾驶和数据引力,说明为:
“数据引力是当数据集变得如此之大以至于物理上无法移动并产生应用程序和分析的‘拉动’时发生的现象。”
Shankar 说,“我们一直在与引力作斗争”,因为这种试图集中数据的过程——这一直是过去 30 年的标准。在 1980 年代,我们尝试将数据集中到数据库中;他说,当这些数据库在 1990 年代开始成倍增加时,我们开始将数据集中在数据仓库中,数据仓库也开始成倍增加。然后出现了企业数据仓库,该解决方案适用于结构化数据,直到非结构化数据出现,此时对数据湖的需求就出现了。
他说,数据引力往往在源位置。我们了解统一数据的价值,但为了获得统一的视图而不断地将数据从源头中提取出来是一场持久战,尤其是考虑到当今数据存储的规模。
数据虚拟化
数据虚拟化找到它所在的数据,并为数据消费者提供统一的视图。它不收集或复制数据,但消费者可以获得相同的见解并且数据保留在同一位置。
Shankar 认为,数据虚拟化提供了四个关键优势:
逻辑数据层,提供一种虚拟方法来访问、管理和交付数据,而无需在物理存储库中复制数据。
跨所有企业系统集成孤立的数据,无论数据格式、位置或延迟如何。
通过集中式安全层进行数据管理,对统一数据及其关系进行编目、搜索、发现和管理。
将集成信息实时交付给业务用户使用的应用程序。
尚卡尔说最大的好处数据虚拟化是通过逻辑视图提供的抽象,因为它将业务用户从底层技术的变化中解放出来。无论数据是从系统 A 移动到系统 B,从本地到云端,从数据仓库到数据湖:“逻辑层可以随时随地获取数据。对于像我这样的企业用户来说,这是一个非常重要的好处。”
数据虚拟化和数据管理的交叉点
考虑到整个企业数据的多样性和数量,业务用户最重要的需求之一是能够在公司内找到特定客户。
“我想要 360 度全方位了解客户与我们的业务实体的关联、我们销售给他们的产品、保修以及家庭和账单信息。” Shankar 说,在这方面,数据虚拟化通过对大量业务数据和定义进行编目并轻松将这些信息提供给业务用户,它已经发展成为更全面的数据管理。
数据虚拟化成功的步骤
Shankar 说,第一步是了解需要为特定业务功能收集的所有数据。部分原因在于了解企业面临的独特问题。“在所有情况下,我的业务都会中断,那么如何在不影响业务的情况下实现架构现代化?”
例如,一些公司可能正在从本地迁移到云,例如,这是否需要在云中购买新技术,或重写现有应用程序。这些组织将希望将数据保留在其源中(无论是在本地还是在云中),并使用数据虚拟化作为抽象层来向业务用户隐藏迁移的复杂性。“一旦他们了解了他们通过数据虚拟化解决的问题,就很容易启动并运行该技术,”他说。
Shankar 提倡从一个部门的系统开始,逻辑整合数据,并快速将数据提供给业务用户以显示投资回报率,然后从那里扩展。
他的客户说,这种方法的最大好处是技术提供的灵活性。“它具有足够的适应性,可以使其分阶段工作,同时节省所需的资源数量。”
挑战:治理的重要性
尽管一旦企业知道要完成什么,数据虚拟化的实际实施就可以相对快速地完成,但尚卡尔建议他的客户强数据治理在流程的早期就位。“你必须了解谁拥有数据,谁使用数据,谁可以修改数据,以及如何在业务范围内使数据可用。”
他的客户面临的挑战不在于技术,而在于定义围绕技术使用的控制的组织方面,这就是治理的用武之地。“我经常看到技术项目被推迟几个月,因为他们没有一个健全的治理框架,我建议在你真正开始技术工作之前把它落实到位。”
德诺多
德诺多是数据虚拟化领域的领导者,以传统方法的一半成本为最广泛的企业、云、大数据和非结构化数据源提供敏捷、高性能的数据集成、数据抽象和实时数据服务。开发中的新改进涉及人工智能和机器学习的集成,以支持业务决策过程。
相关帖子DA内容精选
|