楼主: gong555
1570 3

[数据挖掘理论与案例] 成为数据分析师 [推广有奖]

  • 2关注
  • 5粉丝

已卖:1382份资源

博士生

95%

还不是VIP/贵宾

-

威望
0
论坛币
4265 个
通用积分
58.6302
学术水平
3 点
热心指数
1 点
信用等级
1 点
经验
33834 点
帖子
200
精华
0
在线时间
465 小时
注册时间
2007-3-16
最后登录
2025-12-7

楼主
gong555 发表于 2018-11-23 08:17:13 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
                    数据决策时代,人人都是分析师

         我们生活在一个数据泛滥的时代。数据正以惊人的速度在增长,每个人的下一秒都会被更多的数据包围。我们收集数据的主要目的是完善企业、政府和社会层面的决策制定机制。因此,如果我们无法通过定量分析,利用数据实现更好的决策制定,就是对数据资源的浪费,也有可能造成不良后果。因此,本书致力于为你展示定量分析的运作方式,以及该如何利用定量分析做出更好的决策,即使你没有相关知识背景,也无妨。

         数据,创新产品与服务的源泉

         数据的力量正在各行各业中崛起。如果你热爱运动,那肯定知道《点球成金》(Moneyball)这部电影,影片主角奥克兰运动家棒球队总经理比利· 比恩(Billy Beane)利用球员的表现数据和分析学革新了职业棒球运动。现在,这种革新已经延伸到了所有的主流体育项目当中。如果你喜欢玩在线游戏,可能知道星佳(Zynga)和美国艺电(Electronic Arts),这些社交网络游戏公司正在收集并分析用户所有的游戏行为。那电影呢?你也许知道奈飞(Netflix)可以利用算法预测你可能喜欢的电影,好莱坞的一些制片人会利用算法来推断什么样的电影投资回报率高,美国独立电影公司相对论传媒(Relativity Media)就是这么做的。
         数据种类各不相同。有的数据因为事务性用途被收集和管理,比如,企业和机构通过跟踪员工上班时间和剩余假期所得的数据。当企业收集到大量数据之后,就希望能读懂这些数据,并在此基础上做出决策。同样地,也可以利用分析学来研究与人力资源相关的事务性数据,企业可能会提出“下一年度有多少员工可能会退休”或者“员工休完所有的假期和其年度绩效考核之间是否存在关联”之类的问题。
         不过,数据和分析学的作用并不局限于完善内部决策的制定。像谷歌、Facebook、亚马逊和eBay 等许多立足于互联网的企业,都在利用收集网上交易数据所形成的大数据来支撑决策制定以及为客户提供新产品和服务。无论你是想实现更富成效的内部决策,还是想为客户提供更具价值的产品,分析学必不可少,它会对数据进行汇总、分析,并找出其中的含义和内在关联。要读懂并挖掘出数据的价值,必须借助数学或统计分析,简单地说,就是分析学。
         数据分析的本质
         一般情况下,我们所说的分析是指,使用大量数据、统计和定量分析、解释和预测模型以及基于事实的管理来推动决策过程与实现价值增生。
         根据分析的方法和目的,分析可以被划分为描述性分析(descriptive analytics)、预测性分析(predictive analytics)和规范性分析(prescriptive analytics)。描述性分析包括数据收集、整理、制表、制图以及描述正要研究的事物的特征,这类分析以往被称为“报告”。描述性分析可能非常有用,但它不能解释某种结果出现的原因或者未来可能会发生的事情。
         预测性分析不仅可以对数据特征和变量(可以假定取值范围的因素)之间的关系进行描述,还可以基于过去的数据预测未来。预测性分析初次会确定变量之间的关联,然后基于这种已知关联预测另一种现象出现的可能性,比如在看到某个广告后,一位消费者可能会去买产品的可能性。虽然预测性分析中的预测是基于变量之间的关联做出的,但这并不代表预测性分析都需要明确因果关系。事实上,准确的预测并不一定需要基于因果关系。
        规范性分析是更高层次的分析,如实验设计和优化等。就像医生会在处方上建议患者采取什么行动一样,实验设计试图通过做实验给出某些事情发生的原因。为了能够在因果关系研究中信心饱满地做出推断,研究人员必须妥善处理一个或多个独立的变量,并有效控制其他无关的变量。如果处于实验环境下的测试组的表现大大优于对照组,决策制定者就应该立即推广这种实验环境。
        优化是规范性分析采用的一种方法,指试图识别出一个特定变量与另一个变量之间理想的关系水平。例如,我们可能会对识别最有可能让产品实现高收益的价格感兴趣。同样地,优化这种方法能够识别出使零售企业最大限度避免缺货情况的库存水平。
        根据分析采用的方法以及收集和分析的数据类型,我们可以将分析分为定性分析(qualitative analysis)和定量分析(quantitative analysis)。定性分析的目的是深入了解某种现象出现的根本原因和诱因。非结构化数据通常是从少数非代表性案例中收集而来, 并进行了非统计性的分析。定性分析是分析的最初阶段,它通常是探索性研究的有效工具。定量分析是指通过统计、数学或计算的方法对现象进行系统的实证研究。通常情况下,结构化数据是从大量典型案例中收集而来,并进行统计分析。
        为了服务于研究者的不同研究目的,存在以下几种类型的分析:
        统计学:收集、整理、分析、说明和呈现数据的学科。
        预测:根据已有数据,预测一些感兴趣的变量在未来某个特定时间点的情况。
        数据挖掘:通过使用算法和统计技术,自动或半自动地提取大量数据中未知的有趣模式。
        文本挖掘:用类似于数据挖掘的方式从文本中得出模式和趋势的过程。
        优化:在同时满足约束条件的情况下,按照某些标准,
        利用数学方法来寻找最优的解决方案。
        实验设计:给各组随机分配被试,然后使用测试组和对照组来推导出特定结果中存在的因果关系。
        虽然此处给出了一系列常用的分析方法,但在使用的过程中,会不可避免地出现相当大的重叠。例如,回归分析(regression analysis)是预测性分析中最常用的方法,与此同时,它也是统计学、预测和数据挖掘中常用的方法。此外,时间序列分析(time series analysis)是用于分析数据随时间变化的一种具体统计方法,在统计学和预测中也经常被用到。
        大数据和分析学会改变各行各业的商业职能。任何组织或个人只要抢先一步掌握大数据,就会奠定至关重要的竞争优势,就像在小数据时代占据先机进行数据分析的人能在竞争者中脱颖而出一样。因此,企业和组织机构必须抓住大数据的历史机遇。

        

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


已有 1 人评分经验 论坛币 收起 理由
阿扁V5 + 60 + 10 精彩帖子

总评分: 经验 + 60  论坛币 + 10   查看全部评分

沙发
forget77ant 发表于 2019-1-8 16:11:41
谢谢分享~~~

藤椅
hifinecon 发表于 2019-8-11 17:22:02 来自手机
gong555 发表于 2018-11-23 08:17
数据决策时代,人人都是分析师

         我们生活在一个数据泛滥的时代。数据正以 ...

板凳
zhengcz 发表于 2019-8-13 08:02:48
点赞!谢谢分享。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-16 15:46