楼主: ada89k
12798 102

[基础理论] 【数据分析师分享】常用的14个大数据专业词汇   [推广有奖]

  • 3关注
  • 72粉丝

院士

99%

还不是VIP/贵宾

-

威望
2
论坛币
538792 个
通用积分
14.7458
学术水平
123 点
热心指数
149 点
信用等级
82 点
经验
46289 点
帖子
1667
精华
3
在线时间
2443 小时
注册时间
2017-2-7
最后登录
2024-4-22

楼主
ada89k 在职认证  发表于 2017-7-30 17:52:04 |只看作者 |坛友微信交流群|倒序 |AI写论文
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

数据分析师分享:常用的14个大数据专业词汇




当今随着大数据技术在不断发展和飞速提高,大数据应用已经基本普及到各个方面,大数据与各行各业的关系也越来越紧密关系。现在大数据行业充斥着大量的专业词汇,可能有点人会一头雾水,所以精确掌握和了解这些词汇的含义,有助于非常好的了解大数据,非常好地使用大数据技能。以下整理了以数据处理为中心的14个大数据专业词汇,值得一看。

240435-1F11316324376.jpg




  本地数据库(LDB/Local Data Base)

  本地数据库是指驻留于运行客户应用程序的机器的数据库。本地数据库位于本地磁盘或局域网。典型的本地数据库有Paradox、dBASE、FoxPro和ACCCSS。

  数据采集(Data Acquisition,DAQ)

  数据采集又称数据获取,将被测试对象的各种参量通过各种传感器做适当转换后,再经过信号调理、采样、量化、编码、传输等步骤传递到控制器的过程。

  数据采集的一般步骤:①用传感器感受各种物理量,并把它们转换成电信号;②通过A/D转换,模拟量的数据转变成数字量的数据;③数据的记录,打印输出或存入磁盘文件。④生产厂商为该采集系统编制的专用程序,常用于大型专用系统;⑤固化的采集程序,常用于小型专用系统;⑥利用生产厂商提供的软件工具,用户自行编制的采集程序,主要用于组合式系统。

  数据模型(data model)

  数据模型是现实世界数据特征的抽象,用于描述一组数据的概念和定义。数据模型是数据库中数据的存储方式,是数据库系统的基础。在数据库中,数据的物理结构又称数据的存储结构,就是数据元素在计算机存储器中的表示及其配置;数据的逻辑结构则是指数据元素之间的逻辑关系,它是数据在用户或程序员面前的表现形式,数据的存储结构不一定与逻辑结构一致。

  数据整理(Data Cleansing)

  数据整理是对调查、观察、实验等研究活动中所搜集到的资料进行检验、归类编码和数字编码的过程,是数据统计分析的基础。

  数据处理(Data Handling)

  数据处理是指对数据(包括数值的和非数值的)进行分析和加工的技术过程。也就是对数据的采集、存储、检索、加工、变换和传输,将数据转换为信息的过程。

  数据压缩(Data Compression)

  数据压缩是指在不丢失有用信息的前提下,缩减数据量以减少数据的存储空间,提高其传输、存储和处理效率,或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间的一种技术方法。

  数据恢复(Data Recovery)

  数据恢复是指通过技术手段,将保存在台式机硬盘、笔记本硬盘、服务器硬盘、移动硬盘、U盘等等设备上由于各种原因导致损伤或丢失的数据进行抢救和恢复的技术。

  数据集成(Data Integration)

  数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。数据集成维护了数据源整体上的数据一致性、提高信息共享利用的效率。

  数据迁移(Data Migration)

  数据迁移又称分级存储管理,是一种将离线存储与在线存储融合的技术。将高速、高容量的非在线存储设备作为磁盘设备的下一级设备,将磁盘中常用的数据按指定策略自动迁移到磁带库等二级容量存储设备上。当需要使用这些数据时,分级存储系统会自动将这些数据从下一级存储设备调回到上一级磁盘上。

  数据冗余(Data Redundancy)

  数据冗余是指同一个数据在系统中多次重复出现。消除数据冗余的目的是为了避免更新时可能出现的问题,以便保持数据的一致性。

  数据抽取

  数据抽取是指从源数据源系统抽取目的数据源系统需要的数据的过程。

  网络数据抽取 (Web data mining)

  网络数据抽取(Web data mining),是指从网络中取得大量的又利用价值的数字化信息。主要包括结构化数据抽取(Structured Data Extraction)、信息集成(Informationintegreation)和观点挖掘(Opinion mining)等。

  结构化数据抽取的目标是从Web页面中抽取结构化数据。这些结构化数据往往存储在后台数据库中,由网页按一定格式承载着展示给用户。例如论坛列表页面、Blog页面、搜索引擎结果页面等。信息集成是针对结构化数据而言,其目标是将从不同网站中抽取出的数据统一化后集成入库。其关键问题是如何从不同网站的数据表中识别出意义相同的数据并统一存储。

  数据标准化(data standardization)

  数据标准化是指研究、制定和推广应用统一的数据分类分级、记录格式及转换、编码等技术标准的过程。

  数据备份(Data Backup)

  数据备份是容灾的基础,为防着系统出现操作失误或系统故障导致数据丢失,而将全部或部分数据集合从原来存储的地方复制到其他地方的活动,将数据遭受破坏的程度减到最小。传统的数据备份主要采用内置或外置的磁带机进行冷备份。这种方式只能防止操作失误等人为故障,其恢复时间也很长。现代企业采用网络备份,通过专业的数据存储管理软件结合相应硬件和存储设备来实现备份。

  完全备份(Full Backup)。优点是当发生数据丢失的灾难时,可以迅速恢复丢失的数据。不足之处是每天都对整个系统进行完全备份,造成备份的数据大量重复。

  增量备份(Incremental Backup)。先实施一次完全备份,后续时间里只要对当天的或修改过的数据进行备份。优点:节省了磁盘空间,缩短了备份时间;缺点是数据恢复比较麻烦,备份的可靠性很差。

  差分备份(Differential Backup)。先实施一次完全备份,再将当天所有与备份不同的数据(新的或修改过的)备份到磁盘上。该策略避免了以上两种策略缺陷的同时,具备其所有优点。首先,它无须每天都对系统做完全备份,所需的备份时间短,节省磁盘空间。其次,数据恢复方便。一旦发生问题,用户只需使用完全备份和发生问题前一天的备份就可以将系统恢复。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析师 数据分析 专业词汇 大数据 分析师 大数据 大数据技术 大数据运用 数据分析师 大数据应用

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
麦积山都 + 4 + 4 + 1 观点有启发

总评分: 学术水平 + 4  热心指数 + 4  信用等级 + 1   查看全部评分

沙发
安格鸥 在职认证  发表于 2017-7-30 17:53:06 |只看作者 |坛友微信交流群
大数据领域每年都会涌现出大量新的技术,成为大数据获取、存储、处理分析或可视化的有效手段。大数据技术能够将大规模数据中隐藏的信息和知识挖掘出来,为人类社会经济活动提供依据,提高各个领域的运行效率,甚至整个社会经济的集约化程度。

使用道具

藤椅
麦积山都 在职认证  发表于 2017-7-30 18:23:48 |只看作者 |坛友微信交流群
大数据技术将在开源环境下不断提升,大数据产业将依赖快速聚集的社会资源,在数据和应用驱动的创新下,不断丰富商业模式,构建出多层多样的市场格局,大数据产业生态也将得到不断完善。

使用道具

板凳
脑仁疼 在职认证  发表于 2017-7-30 18:37:32 |只看作者 |坛友微信交流群

回帖奖励 +3

大数据技术能够将隐藏于海量数据中的信息和知识挖掘出来,为人类的社会经济活动提供依据,从而提高各个领域的运行效率,大大提高整个社会经济的集约化程度。

使用道具

报纸
698348 在职认证  发表于 2017-7-30 18:50:40 |只看作者 |坛友微信交流群

回帖奖励 +3

大数据往往是利用众多技术和方法,综合源自多个渠道、不同时间的信息而获得的。为了应对大数据带来的挑战,我们需要新的统计思路和计算方法。

使用道具

地板
钱学森64 发表于 2017-7-30 19:37:12 |只看作者 |坛友微信交流群

回帖奖励 +3

谢谢分享,非常实用

使用道具

7
firebig 发表于 2017-7-30 21:15:04 |只看作者 |坛友微信交流群

回帖奖励 +3

感谢分享

使用道具

8
zhx0524 在职认证  发表于 2017-7-30 22:37:52 |只看作者 |坛友微信交流群

回帖奖励 +3

好棒,学习了

使用道具

9
gewenhong66 发表于 2017-7-30 23:40:38 |只看作者 |坛友微信交流群

回帖奖励 +3

thank a lot

使用道具

10
lhf8059 发表于 2017-7-31 08:31:34 |只看作者 |坛友微信交流群

回帖奖励 +3

thank a lot

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 11:43