楼主: ada89k
1274 0

[校园话题] 【数据分析师分享】什么是大数据,大数据有哪些特征? [推广有奖]

  • 3关注
  • 72粉丝

院士

99%

还不是VIP/贵宾

-

威望
2
论坛币
2991 个
通用积分
24.8376
学术水平
123 点
热心指数
149 点
信用等级
82 点
经验
46289 点
帖子
1667
精华
3
在线时间
2458 小时
注册时间
2017-2-7
最后登录
2024-8-9

楼主
ada89k 在职认证  发表于 2017-5-23 21:37:59 |只看作者 |坛友微信交流群|倒序 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

什么是大数据,大数据有哪些特征?



1.大数据是具备3V特征(Volume 大体量、Variety复杂多样、Velocity 高速时效)的数据源。大众很容易理解 Volume,互联网公司、运营商和金融机构的数据量动辄以TB计,却往往会忽视 Variety 和 Velocity。

Variety 是指大数据来源丰富、形态多样,常见的大数据就包括电商用户数据、文本数据、社交网络数据、车载信息服务数据、时间和位置数据、RFID数据、智能电网数据、设备传感器数据等等。

Velocity 是指大数据一边高速海量生成,同时数据的分析和应用也实时完成,比如,网络广告程序化购买、互联网金融实时授信,都涉及到实时处理海量数据的技术。

2. 大数据也是一个相对的概念,目前的“小数据”,曾经也是“大数据”。比如ERP、CRM里导出的数据,现在用excel就能轻松驾驭,但在几十年前,放在当时的技术条件下,这样的数据又何尝不是大体量、多样、高速的 "大数据"。目前的“大数据”,随着技术发展,未来也会成为能够轻松驾驭的“小数据”。

3. 大数据通常都是机器自动生成的,例如物联网中传感器自动生成环境数据。而传统数据的生成往往涉及人工因素,例如零售交易、电话呼叫等等。

4. 大数据往往不是 “结构化” 的,因此难以驾驭。收集传统数据源的交易系统通常会以整洁的、预先规范好的模板方式来生成数据,以确保数据容易被加载和使用。而大数据源在最开始通常不会被严格地定义,而是去收集所有可能使用到的信息。
常见的财务报表就是典型的 “结构化” 数据,表头明确了数据的类别、科目,整洁规范。
网络日志则是“半结构化”数据的代表,看起来乱七八糟,完全谈不上整洁规范,但其中每一条信息却都有特定用处。
而文本,诸如博客文章、论坛评论则是 “非结构化” 数据,必须耗费大量精力进行转化和清洗,才能进行分析和利用。


5. 很多数据可能就是垃圾,并不蕴含大量价值。事实上,大部分数据甚至毫无价值。一篇网页日志中会含有非常重要的数据,但其中也包含了很多根本没有价值的数据。对其进行提炼,从而保留有价值的部分是非常必要的。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:什么是大数据 数据分析师 数据分析 大数据 分析师 数据分析师 大数据 大数据特征 什么是大数据 大数据概念

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-6 05:25