楼主: Mirror..
1222 2

[行业动态] 数据准备是大数据分析的无名英雄 [推广有奖]

已卖:5份资源

院士

21%

还不是VIP/贵宾

-

威望
1
论坛币
67318 个
通用积分
10.5248
学术水平
502 点
热心指数
518 点
信用等级
460 点
经验
42800 点
帖子
2405
精华
2
在线时间
716 小时
注册时间
2014-11-10
最后登录
2019-4-21

初级学术勋章 初级热心勋章 中级学术勋章

楼主
Mirror.. 在职认证  发表于 2015-2-5 09:38:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
111.jpg

随着企业花越来越多的时间来分析数据清理和准备数据的解决方案将会变得更有价值

现在大数据是热门话题,你在任何地方与任何人交谈很难不提到大数据。事实上,大数据的术语有点被过度使用,它对不同的人意味着不同的东西,但所有这些定义都有一个共同点,那就是数据!

上面我们说大数据依赖于数据,这似乎很明显,但大数据分析的成功需要的不仅仅是原始数据,还需要好的高质量数据。所以,更准确的说法应该是,大数据的成功需要准备好的数据。对于分析,有句古老的格言,“进来是垃圾,出去也是垃圾”,这意味着如果你把大量参差不齐的数据放到分析解决方案,你将会得到不好的结果。

数据的清理和准备历来都是漫长的艰巨的耗时的过程。当笔者还在Yankee Group公司时,他们迁移CRM系统,在迁移工作之前,该公司花了一年时间来清理现有系统中的记录数据,以确保不会迁移不好的数据。虽然他们做了这么多工作,仍然有很多不良信息被迁移过去。

最近,笔者看到一家被称为Paxata的公司,该公司提供的解决方案可以进行所谓的“自助服务自适应数据准备”。在分析或运营报告工作之前,该技术可以整合、清理和形成数据。市面上很多现有的商业智能产品声称可以简化分析过程,但事实是,大多数数据科学家和数据分析师花费大量时间来为分析准备数据。鉴于此,笔者认为,大多数企业宁愿聘请高薪人才找出数据的含义(+微信关注网络世界),而不是清理数据。

Paxata提供数据整个生命周期的准备,包括探索、清理、更换、形成和发布数据以进行分析。该产品还允许不同的数据团队共享相同的数据集,让不同的团队可以同时编辑和访问多个设备的信息。该产品还是一个管理解决方案,它会追踪项目内的每个步骤,并有完全的重放功能来审查已经完成的更改。

Paxata的用户以提高对大型数据集的分析生产率,同时最小化数据蔓延的危险。该产品既可作为云服务—确保数据准备的灵活性,也可以作为内部部署的解决方案,它可以整合到Hadoop以更快获取价值。

正如上文所述,大数据现在是一个热门话题,但企业和IT领导者需要明白,分析糟糕的数据意味着糟糕的分析结果,可能会造成错误的商业决策。正因为如此,笔者希望看到数据准备技术会开始像大数据一样热门。

本文来自:互联网分析沙龙


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:大数据分析 数据分析 大数据 商业智能产品 Yankee 解决方案 热门话题 共同点 格言 海南

只想做一个勤勤恳恳的搬运工

沙发
crackman 发表于 2015-2-5 09:50:53
插入式广告不少,虽然看似软文
但是观点值得思考
做数据分析一般的时间确实是在整理复核数据分析要求的数据集
如果第一步数据清理出问题了,得出的问题就是荒谬的。

藤椅
Mirror.. 在职认证  发表于 2015-2-5 11:00:27
crackman 发表于 2015-2-5 09:50
插入式广告不少,虽然看似软文
但是观点值得思考
做数据分析一般的时间确实是在整理复核数据分析要求的数 ...

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-26 17:21