数据科学(Python/R/Julia)数据分析、机器学习、深度学习 Q群:874447702
云计算就在这里。然而,数据在云端迁移正在变得令人烦恼。根据McAfee公司的调查,97%的组织使用公共云或私有云服务。大数据也开始超越本地部署/云计算差距。IDG公司发现,41%的企业已经将存储、归档、备份、文件服务器迁移到云端,21%的企业计划在未来一年内迁移存储、归档、备份、文件服务器。
这些数字对于云计算采用率和云计算大数据供应商来说都是个好消息。因为那时人们会看到59%的企业没有迁移,或者79%的企业没有迁移计划。人们想知道,在生成和使用数据的应用程序附近存放大数据具有很多好处,为什么很少有企业能够抢先一步?
事实证明,答案很简单:这真的很难。
为什么数据云迁移陷入困境
要使用现有的模式和工具将大数据迁移到云端,需要非常强大的技术能力,并且需要大量的资金。看看Lyft公司的AWS云计算帐单,就会明白这么多公司都不愿尝试的原因。
这是一个新闻:将大数据迁移到云需要技巧。暴力行为不起作用,这就是62%的大数据迁移工作比预期或失败更难完成的原因。
IT利益相关者倾向于忽视物理学仍然参与的事实,即使在数字世界中也是如此。当前的方法试图通过数字等效的集装箱存储产品大量移动数据,忽略数据不是静态货物这一事实。它不断变化。迁移期间业务不会停止。即使企业将数据迁移到云平台,数据也会不断流入现有的本地存储中。这使得迁移期间维护数据完整性非常复杂。由于常见的解决方法往往不尽如人意,因此许多迁移陷入困境。
避免陷阱:数据云迁移的五条要点
为了避免大数据云迁移的陷阱,避免使用暴力手段。采用更精细和复杂的方法,并记住以下大数据云迁移的五条要点。
要点1:需要了解自己的数据
在开始迁移项目之前,请确保企业真正了解数据源。创建一个系统流程来识别作为迁移候选者的数据源。然后,对于每个来源,问问自己:
这些数据是否有效和/或实际用于任何事物?
从1到10的迁移优先级有多高?
从1到10的优先级,迁移将涉及多少工作?
迁移期间和迁移后维护数据的成本和风险是什么?
要点2:不能提升和转移
直言不讳的说,提升和转移方法代表了最终的暴力云迁移,其中应用程序和相关数据从内部部署环境“提升”并“转移”到云平台。问题在于,本地环境和云环境是苹果和橙子的区别。当然,他们都是圆的。仅仅因为企业架构在本地工作得很好,并不意味着它在分布式计算环境中有意义。
要点3:寻求节省成本的方法
将大数据迁移到云端提供了许多优势:它是一个生产力涡轮增压器;它是前所未有的业务洞察力的深层次来源;它是了解客户和趋势、密切接触和个性化数据的全新方式。然而,这不是省钱的方法。企业可以并且应该控制迁移和运营费用,但不要期望以更低的价格获得基于云计算的大数据的巨大优势。
要点4:需要投资内部团队
由于IT资源有限且团队已经很忙,大多数中小企业缺乏管理云迁移所需的内部带宽和专业知识。当然,外包是一种解决方案,但将内部培训视为一种投资。分布式计算需要特定的技能组合,企业的云计算投资不仅应该在服务中,还应该在其员工中。
要点5:不要将数据视为责任
随着有效迁移到云端的巨大努力和复杂性,IT利益相关者、员工和管理人员都可以开始将组织大数据视为比财富更多的责任。不要让这种情况发生。不要只存储企业需要的东西而扔掉剩下的东西,那里有隐藏的价值。当企业进行迁移时,需要更好地保存数据这样重要的东西。
数据云迁移的底线
随着大数据迁移到云端,最重要的是不会削减它。提升和转移以及其他强力迁移技术在数据完整性方面留下了问题,最终会增加迁移开销,有时甚至是令人望而却步。新一轮的迁移方法更加温和、更具有阶段性,而且用户和成本友好。有了合适的工具,企业的云采用策略就不需要花费太多时间。仍然可以在今年发生。