请选择 进入手机版 | 继续访问电脑版
楼主: 浪子彦青
2090 2

[数据挖掘理论与案例] 大数据与数据挖掘到底是什么关系? [推广有奖]

院士

39%

还不是VIP/贵宾

-

威望
1
论坛币
3261 个
通用积分
127.5958
学术水平
74 点
热心指数
87 点
信用等级
63 点
经验
27325 点
帖子
1719
精华
0
在线时间
421 小时
注册时间
2016-6-4
最后登录
2021-2-1

浪子彦青 在职认证  发表于 2016-12-3 14:33:20 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
就我个人理解:数据挖掘基于数据库理论,机器学习,人工智能,现代统计学的迅速发展的交叉学科,在很多领域中都有应用。涉及到很多的算法,源于机器学习的神经网络,决策树,也有基于统计学习理论的支持向量机,分类回归树,和关联分析的诸多算法。数据挖掘的定义是从海量数据中找到有意义的模式或知识。

大数据是今年提出来。大数据有三个重要的特征:数据量大,结构复杂,数据更新速度很快。由于Web技术的发展,web用户产生的数据自动保存、传感器也在不断收集数据,以及移动互联网的发展,数据自动收集、存储的速度在加快,全世界的数据量在不断膨胀,数据的存储和计算超出了单个计算机(小型机和大型机)的能力,这给数据挖掘技术的实施提出了挑战(一般而言,数据挖掘的实施基于一台小型机或大型机,也可以进行并行计算)。Google提出了分布式存储文件系统,发展出后来的云存储和云计算的概念。

大数据需要映射为小的单元进行计算,再对所有的结果进行整合,就是所谓的map-reduce算法框架。在单个计算机上进行的计算仍然需要采用一些数据挖掘技术,区别是原先的一些数据挖掘技术不一定能方便地嵌入到 map-reduce 框架中,有些算法需要调整。

此外,大数据处理能力的提升也对统计学提出了新的挑战。统计学理论往往建立在样本上,而在大数据时代,可能得到的是总体,而不再是总体的不放回抽样。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘 大数据 Map-Reduce 数据挖掘技术 reduce 大数据与数据挖掘到底是什么关系 大数据分析 数据挖掘 大数据与数据挖掘区别 大数据的特征

无wei 发表于 2016-12-3 14:40:59 |显示全部楼层 |坛友微信交流群
感谢分享

使用道具

个人觉得数据挖掘是一门技术,是相对比较狭义上的一个概念。
而大数据更像一个产业,数据挖掘当然是其一个核心技术。但是,大数据与数据挖掘不同的是,他还涉及到其他广泛的技术,其中代表的如可视化技术,数据存储和管理技术。
大数据不仅仅是利用数据挖掘技术从数据中挖掘有用的信息, 他还要采取海量数据,通常要分布实时处理,最后利用要组织数据挖掘技术得到的信息,向用户直观的展示这些信息~

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 02:48