楼主: 时光永痕
1109 0

[数据挖掘新闻] 分析简史 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)八级

11%

威望
0
论坛币
26 个
通用积分
57.2238
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34180 点
帖子
2732
精华
0
在线时间
321 小时
注册时间
2020-7-21
最后登录
2024-8-1

楼主
时光永痕 学生认证  发表于 2022-5-27 09:45:39 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
从历史上看,分析的一个简单定义是“分析研究”。更有用、更现代的描述表明“数据分析”是获取业务洞察力和为客户提供量身定制的响应的重要工具。数据分析,有时缩写为“分析”,对于各种规模的组织来说变得越来越重要。随着时间的推移,数据分析的实践逐渐发展和扩大,提供了许多好处。

这使用分析早在 19世纪,弗雷德里克·温斯洛·泰勒 (Frederick Winslow Taylor) 发起了时间管理练习。另一个例子是亨利福特测量装配线的速度。在 1960 年代后期,随着计算机成为决策支持系统,分析开始受到更多关注。随着发展大数据、数据仓库、云以及各种软件和硬件,数据分析已经显着发展。数据分析涉及数据中模式的研究、发现和解释。现代形式的数据分析已经扩展到包括:

预测分析
大数据分析
认知分析
规范性分析
描述性分析
企业决策管理
零售分析
增强分析
网络分析
呼叫分析
统计和计算机
数据分析基于统计数据。据推测,统计数据早在古埃及就被用于建造金字塔。世界各国政府已将基于人口普查的统计数据用于各种规划活动,包括税收。收集数据后,发现有用信息和见解的目标就开始了。例如,对县市人口增长的分析可以确定新医院的位置。

计算机的发展和计算技术的发展极大地增强了数据分析的过程。1880 年,在计算机出现之前,美国人口普查局花了七年多的时间处理收集到的信息并完成最终报告。作为回应,发明家 Herman Hollerith 生产了用于 1890 年人口普查的“制表机”。制表机可以系统地处理数据记录在打孔卡上. 有了这个设备,1890 年的人口普查在 18 个月内就完成了。

关系数据库和非关系数据库
关系数据库由 Edgar F. Codd 在 1970 年代发明,并在 1980 年代变得非常流行。反过来,关系数据库 (RDBM) 允许用户编写续集 (SQL) 并从其数据库中检索数据。关系数据库和SQL提供了能够按需分析数据的优势,并且仍然被广泛使用。它们易于使用,并且对于维护准确的记录非常有用。不利的一面是,RDBM 通常非常僵化,并不是为了翻译非结构化数据而设计的。

在 1990 年代中期,互联网变得非常流行,但关系数据库却跟不上。巨大的信息流与来自许多不同来源的各种数据类型相结合,导致了非关系数据库,也称为 NoSQL。NoSQL 数据库可以使用不同的语言和格式快速翻译数据,并通过以更大的灵活性替换其“有组织的”存储来避免 SQL 的僵化。

随着 NoSQL 的发展,互联网也发生了变化。Larry Page 和 Sergey Brin 设计了 ​​Google 的搜索引擎来搜索特定网站,同时在分布式计算机中处理和分析大数据。谷歌的搜索引擎可以在几秒钟内响应所需的结果。该系统的主要关注点是其可扩展性、自动化和高性能。2004 年白皮书MapReduce 的主题启发了几位工程师,并吸引了大量人才专注于处理大数据(数据分析)的挑战。

数据仓库
在 1980 年代后期,收集的数据量继续显着增长,部分原因是硬盘驱动器的成本较低。在此期间,建筑数据仓库旨在帮助将来自运营系统的数据转换为决策支持系统。数据仓库通常是云的一部分,或者是组织大型机服务器的一部分。与关系数据库不同,数据仓库通常会针对查询的快速响应时间进行优化。在数据仓库中,数据通常使用时间戳来存储,而DELETE或UPDATE等操作命令的使用频率较低。如果所有销售交易都使用时间戳存储,则组织可以使用数据仓库来比较每个月的销售趋势。

商业智能
术语商业智能(BI) 于 1865 年首次使用,后来在 1989 年被 Gartner 的 Howard Dresner 改编,用于描述通过搜索、收集和分析组织保存的累积数据来做出更好的业务决策。使用“商业智能”一词来描述基于数据技术的决策,既新颖又具有远见。大公司首先以系统分析客户数据的形式采用 BI,将其作为制定业务决策的必要步骤。

数据挖掘
数据挖掘始于 1990 年代,是在大型数据集中发现模式的过程。以非传统方式分析数据提供了令人惊讶和有益的结果。数据挖掘的使用直接源于数据库和数据仓库技术的发展。新技术使组织能够存储更多数据,同时仍能快速有效地对其进行分析。因此,企业开始根据对客户历史购买模式的分析来预测客户的潜在需求。

但是,数据可能会被误解。业内人士在网上购买了两条蓝色牛仔裤后,可能再过两三年都不想再购买牛仔裤了。用蓝色牛仔裤广告定位此人既浪费时间,又会刺激潜在客户。

大数据
2005 年,大数据由 Roger Magoulas 命名。他正在描述大量数据,使用当时可用的商业智能工具似乎几乎无法应对。同年,Hadoop,可以处理大数据,被开发出来。Hadoop 的基础是基于另一个名为 Nutch 的开源软件框架,该框架随后与 Google 的 MapReduce 合并。

阿帕奇Hadoop 是一个开源软件框架,它可以处理结构化和非结构化数据,从几乎所有数字源中流入。这种灵活性允许 Hadoop(及其兄弟开源框架)处理大数据。在 2000 年代后期,一些开源项目,例如 Apache火花和阿帕奇卡桑德拉来应对这一挑战。

云端分析
在其早期形式中,云端是用来描述用户和提供者之间的“空白空间”的短语。然后,在 1997 年,埃默里大学教授拉姆纳特·切拉帕将云计算描述为一种新的“计算范式,其中计算的边界将由经济原理决定,而不仅仅是技术限制”。

1999 年,Salesforce 提供了一个如何成功使用云计算的早期示例。虽然按照今天的标准来看是原始的,但 Salesforce 使用这个概念来发展通过 Internet 交付软件程序的想法。任何可以访问互联网的人都可以访问或下载程序(或应用程序)。组织经理可以在不离开办公室的情况下以经济高效的按需方式购买软件。随着企业和组织对云的服务和用途有了更好的了解,它越来越受欢迎。

云有显着发展自 1999 年以来,客户“租用服务”,而不是出于相同目的购买硬件和软件。供应商现在负责所有故障排除、备份、管理、容量规划和维护。而且,对于多个业务项目,云使用起来更简单、更高效。云现在拥有大量的存储空间,同时可供多个用户使用,并且能够处理多个项目。

预测分析
预测分析用于对趋势和行为模式进行预测。预测分析使用来自统计、数据建模、数据挖掘的多种技术,人工智能,以及机器学习来分析数据以进行预测。预测模型可以分析当前和历史数据,以了解客户、购买模式、程序问题,并预测组织的潜在危险和机会。

预测分析始于 1940 年代,当时政府开始使用早期的计算机。虽然已经存在了几十年,预测分析现在已经发展成为一个时机成熟的概念。随着越来越多的可用数据,组织已开始使用预测分析来增加利润并提高其竞争优势。存储数据的持续增长,加上对使用数据获得商业智能的兴趣日益浓厚,促进了预测分析的使用。

认知分析
大多数组织处理非结构化数据。理解这些非结构化数据并不是人类可以轻易做到的。认知分析合并各种应用程序以提供上下文和答案。组织可以从多个不同来源收集数据,认知分析可以深入检查非结构化数据,让决策者更好地了解他们的内部流程、客户偏好和客户忠诚度。

增强分析
增强分析通过使用自然语言处理和机器学习提供自动化的商业智能(和洞察力)。它“自动化”数据准备并实现数据共享。增强分析提供清晰的结果和复杂工具的访问权限,使研究人员和管理人员能够高度自信地做出日常决策。它使决策者能够获得洞察力并迅速自信地采取行动。

最终,增强分析试图通过自动化获得洞察力和商业智能的步骤来减少数据科学家的工作。增强的分析引擎将自动处理组织的数据、清理数据、分析数据,然后产生洞察力,从而为高管或销售人员提供指导。

投资组合分析
投资组合分析通常由贷款机构或银行使用,并且是具有不同价值和风险的账户的集合。投资组合中的账户可能包括有关其客户的社会地位(穷人、中产阶级、富人)、地理位置和许多其他因素的信息。投资组合分析允许贷方平衡贷款回报与违约风险。贷款的风险取决于收入、先前贷款的成功和破产宣告等因素。

人力资源分析
HR 分析最初称为“人员分析”,是一种行为数据,用于了解人们的工作方式以及他们如何改变组织的管理方式。人力资源分析也被称为劳动力分析、人才分析、人才洞察、人才洞察、同事洞察和人力资本分析。人力资源分析用于帮助企业管理其人力资源,是分析和预测劳动力市场趋势的战略工具。

客户旅程分析
客户旅程涉及客户在与组织或品牌互动时所经历的整体体验。客户旅程不是专注于体验的一部分,而是记录客户的完整体验。

客户旅程分析检查记录的信息并提供有关客户体验的见解(通常是实时的)。它有助于了解客户,并影响公司设计客户体验的方式。客户旅程分析支持评估和监控客户旅程并改进流程的系统方法。开发和提供最佳客户体验是最终目标。

      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:MapReduce Frederick Internet Frederic GARTNER

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-6 14:42