楼主: lt51
1241 1

[Hadoop] 《决战大数据》——大数据的应用 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

学前班

40%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
30 点
帖子
1
精华
0
在线时间
0 小时
注册时间
2018-11-28
最后登录
2018-11-28

lt51 发表于 2018-11-28 16:42:44 |显示全部楼层
摘要大数据的应用阶段已经从发现问题、分析问题过渡到帮助企业挖掘更大的商业机会、辅助高层决策了。于此同时,很多企业的数据应用依然停留在表面,不仅错过了大数据蕴藏的巨大商业机会,也没有用数据给企业带来实打实的利润。因此,本书的核心内容是分享作者在数据领域深耕十几年的经验,阿里巴巴数据实战应用的方法论,以及提出了大数据在未来实战层面上的应用趋势。

关键字:大数据  商业企业  应用趋势

作者简介

车品觉,阿里巴巴集团前副总裁,首任阿里数据委员会会长,畅销书《决战大数据:驾驭未来商业的利器》作者;拥有十几年丰富的数据实战经验,并在实践中形成了独特的数据化思考及管理方式,对大数据未来趋势有独到的见解。亲自领导阿里数据团队在大数据实践领域取得了一系列重要成果,包括为阿里建立集团各事业群的业务及决策分析框架,开发智能化的数据产品,成立了驱动集团数据化的运营团队,成功发起了公共与专有数据资产管理体系,还发布了数据安全规范等。

现担任中国信息协会大数据分会副会长、中国计算机学会大数据专家委员会副主任、粤港信息化专家委员、中国计算数学学会第九届理事、清华大学教育指导委员(大数据项目)、浙江大学管理学院兼职教授等职。

本书背景简介

大数据在收集消费者全渠道行为、触发商业机遇等方面发挥了越来越重要的作用。而《决战大数据》一书恰恰洞悉了大数据时代商业发展的本质。同时,车品觉根据多年经验,通过丰富的案例和通俗易懂的语言,从“养数据”到“用数据”,深入浅出地向我们揭开了大数据化运营和运营数据的神秘面纱。通过《决战大数据》一书,车品觉告诉我们,在数据无限的时代,拥有数据化思维,才能改变商业的未来。

   

本书特点

大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流 软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
这本书,理论上看起来都很完美,但是如果不能用现实的案例来验证,这本书就是一本“别人的书”。因为书里的思想,有可能是过期的,有可能是别人编撰的,成为不了你的思想。每个人的思想都是独一无二的,哪怕是“乌合之众”的一员,同样也带有自己的情感诉求,放到陌生的环境,依然有自己处理问题的方式。该书有着作者本人独到的思想和见解,作者以自己多年的工作经验和经历,用着大家能理解的方式位我们讲述了大数据的相关知识。在学习这本书的同时,我们还要将它应用于生活的实践中,让它的优势得以施展。所以,此书十分值得去读。

       

第一章 大数据怎样从说到用

1.1大数据的复杂性与真实性

断层才是大数据所面临的最严重的问题。现在,收集数据的人并不清楚未来使用数据的人要做什么,这是目前大数据的一大关键命门。
不只是收集数据的人不知道将来的人怎么使用数据,就连创建模型的人也不知道自己所采用的数据在未来是否稳定,而使用模型的人也不知道整个数据的来路或加工过程,这些都是普遍存在且很现实的问题。

1.2大数据的本质就是还原

据变成动态数据,必须要用场景来验证。数据收集的价值包含两个维度。一方面,你是否能衡量这个数据对企业产生的价值——你不会将用户的所有行为都记录下来,而是记录那些对企业自身有帮助的数据,即企业价值;另一方面,你是否能衡量这个数据对顾客的价值——这个数据如何帮助企业为客户提供更好的服务,即客户价值。从企业价值来看,数据收集实现了企业资源的合理分配。从客户价值来看,数据收集实现的是顾客体验的提升。

我的观点是,数据价值的确要分是从谁的角度出发的。所以,当我们谈大数据价值的时候,第一点要注意的就是角色不一样,对于数据价值的看法也就不同,所以在衡量价值时要考虑到受众和给予者这两个对立面的不同看法。在招场景与还原并行——前端还原消费者场景,后端还原业务需求。

数据的本质就是还原,这是收集元数据的关键方法。

我认为,数据的本质就是还原,这是收集元数据的关键方法。如果没有这个概念,就会不知道未来你需要什么数据,更不会知道什么是重要的数据。一旦数据多到了连自己的公司都没有办法处理的时候,那么其他会处理的人、公司和国家就会把你毫不留情地挤出市场。

1.3“活”做数据收集

“死”数据就是单纯存储在数据库中,无法进行分析和使用,不能带来真正价值的数据。其真正价值是将数据用于形成主动收集数据的良性循环中,以带动更多的数据进入这个自循环中,并灵活运用于各个行业。

在数据的自循环中,有两个核心的关键点:一个是“活”做数据收集,另一个是“活”看数据指标。所谓“活”做数据收集,就是指企业不要局限于只收集自己用户产生的数据,还要把“别人”的数据收集过来进行综合分析;“活”看数据指标,就是指企业不要局限于已有的数据框架,而应该结合用户需求的不同场景来灵活应用收集到的“活”数据。

“活”看数据指标,动态地使用数据 把数据激活,从静态数“活”用数据,就是你是否能看出这个数据本身的局限是什么。一方面,是我们的数据为用户体验改善了什么;另一方面,企业在使用数据时,对活数据的运用解决了什么问题或者开创了什么机会。要牢牢记住,活用数据很重要。

1.4、把大数据做小

所有数据分析过程应该针对一些很具体的问题的,为太宽泛的目标收集数据,得到的结果要么无法满足需求方的要求,要么就对决策毫无做用。在我们面对一个问题时,首先我们应该将一个大问题划分成系列的小问题,且假设这些小问题都是可以通过获取数据来解决掉的。解决小问题时,我们需要建立起对应这个问题的”框架“。这个框架,就是解决某一小问题后能够进行决策的逻辑体系。”很多人在没有获取足够数据,并且缺乏对数据理解情况下做出决策,其实是在“享受”自己的无知”。

1.5、数据的分类与价值

数据作为一种资产,不同的数据含金量必然不同,自然就会产生不同的价值。而且,就同一组数据而言,在不同的环境下甚至会呈现出不同的价值。从数据分类的角度来看,可以将之分为以下4种。 1.按照是否可以再生的标准来看,可以分为不可再生数据和可再生数据。不过千万不能因为“可再生”这个词语的存在,就对可再对不可再生的数据而言,已有的数据要严格保护,想要但是还没有的数据就要及早收集。2.按照数据所处的存储层次来看,可以分为基础层、中间层和应用层。任何管理方法,无论是集中式管理,还是分散式管理,都各有利弊,而且人和业务多了之后,企业也很难进行集中式管理。我给出的建议是,基础层必须统一,因为这是最基本的数据,而且基本数据是原始数据。除了备份的需求外没有必要在各个场合保留多份数据。只要保证这个数据有良好的元数据管理方式,就能极大地降低成本。3.各个数据主体。内容,在平台型电商可以分为交易类数据、会员类数据、日志类数据等。4.按照是否为隐私来区分,可以分为隐私数据和非隐私数据。

1.6、从用数据到养数据

数据应用因小而美 “小”不是指数据量,而是指应用的目标很具体。

把数据放进“框”之中 在大数据的背景下,必须考虑数据之间的关联性。一个单独的数据是没有意义的,要把数据放在一个“数据框架”(场景)之中,才能看出存在的问题。

如何用框架来做决策 想要解决的问题越复杂,框架也就越复杂。但是,决策最重要的前提是要从小角度切入,从“小”做起。 对此,我总结了4步走的方法: 1.首先确定有什么问题,从解决问题的角度出发去收集数据。 2.把收集到的数据整理好,放入一个“数据框架”内(这个框架是用来帮助决策者做决定的)3.看框架与做决策的关系。4.根据决策行动,然后检查行动是否达到目的。

“用数据”更多的是一种方法论,而“养数据”则是一种数据战略,是基于深入业务理解的更高层次的商业决策。

养数据通常有两类,一类是网站自身没有的数据,需要用户主动提供的;另一类是公司拥有的,但没有进行收集的数据。

有一个问题必须得到解决,那就是假定数据都是可以获得的情况下,什么样的数据才是关键?  

第二章   阿里巴巴数据人才的培养

2.1“混、通、晒”——阿里巴巴培养数据人才的“内三板斧”

作者在阿里巴巴任职期间,总结了一套“内三板斧”和“外三板斧”的办法,对内,用来培养数据人才,对外,实现数据应“混”,指的是帮

巴通过车品觉主张的“混”在一起,把部门之间的隔阂给打“通”了。团队合作也变得更加和谐高效。把数据打通,一是商业理解和数据之间的“通”,另一种就是部门数据和部门数据的交叉。

“晒”,指的是,最终的数据表现和结果,是人、商业和数据结合之后的一种“看数据”和“用数据”的方法论。在阿里巴巴,“晒”通常是通过数据来回答几个关键问题,比如:业务现在发展的好还是不好,如何利用数据帮助业务部门发现机会等等。“晒”是产生组织力量的过程,同样也适用于企业内部。

2.2“存、管、用”——阿里巴巴的数据应用“外三板斧”

“存”,指的是收集数据,收集起来的数据产生价值。盲目的收集不旦不会给企业创造价值,还会增加昂贵的存储和管理成本,即使像阿里巴巴这样的公司,也承担不起无限收集数据和管理数据的成本。所以,车品觉建议,企业在收集数据之前一定要有一个特定的目的。

“管”,指的是对存储数据进行保管,以确保数据的安全、准确等等。数据管理的内容包括很多方面,比如:数据的来源,如何让数据不丢失,如何保护数据的安全,如何让数据准确稳定,以及如何更好的运用数据,这些都是数据运营当中的“管”。

“用”,指的是思考“如何应用数据解决运营中存在的问题”。就拿电商的用户标签来说,阿里总共有18个用户性别标签,这些标签并不是真正意义上的生理性别,而是从用户的购物属性上定义出来的性别。比如说:夫妻俩共用一个账号,早上妻子用,晚上丈夫用,那这个账号在阿里巴巴的性别标签就是“早女晚男”。在数据应用的过程中,把本来不可以分裂的东西分裂之后再重组,就能产生新的数据价值。

第三章      大数据在未来的应用趋势

作者以十几年的数据实战,对未来的数据应用有六个方向的趋势预测,分别是:应用无线化、信息数据化、交易无纸化、人类智能化、决策实时化、线下线上化。这一部分,我们来分享 “信息数据化、决策实时化和人类智能化”三个方面。

3.1、信息数据化

未来会有更多的信息被数据化。由于技术限制,很多有价值的信息还不能被收集成数据,随着科技的发展,这些信息都将被数据化。比如,人脸识别技术就能让零售门店的客户信息被数据化。店员不需要再问“您需要些什么”这样的问题,就能给出相应的商品推荐。当更多有价值的信息被收集成数据,各个行业都将面临巨大的冲击。每个行业都要思考,在这一波数据红利上,如何抢占先机,管理好自己的用户数据,提升用户体验。

3.2、决策实时化

生活中我们遇到的很多问题,都是因为没有得到及时的反馈,导致我们无法作出正确决策。如果银行提前告诉你,再不还款就会收取额外利息,相信很多人都不会忘记还款了。再比如,如果糖尿病患者可以实时的了解自己的血糖水平,知道当下的这一餐会让血糖升高到多少,就能决定眼前这一餐要不要全吃光。

在未来激烈的商业竞争当中,企业影响消费者进行实时决策的能力会越来越重要。越是能够在短时间内抓住消费者,就越容易卖出产品,实现更高的顾客转化率。

3.3、人类智能化

随着可穿戴设备的出现,人和数据开始逐步融合,像谷歌眼镜这样的设备,将让我们看到的东西即时数据化;类似健康手环类设备和可以深度收集脑电波的数据设备,将随时会使我们人体的活动转化成数据。

在不远的将来,用数据记录实时记录生活将成为可能。彼时,数据将会帮助人们做出更好的判断,人类也会变得更加智能。未来,一个人的能力和聪明程度的不是由 IQ 决定的,而是这个人是否拥有足够的数据。

第四章    自我提高

从这本书中,我真的知道了很多大数据相关的知识,而且也收获了许多,通过这本书我明白了,大数据究竟能带来什么价值,怎么衡量大数据创造的价值。事实上,最直接的衡量标准就是,在经营上它为你赚了多少钱,带来了多少实际的利润提升。读完此书后收获颇多,收获如下:

1. 数据的本质是还原用户的真实需求。

数据记录了用户在什么时间,访问了产品的哪个功能,访问路径是什么,停留时间是多久,最后离开是什么时间,最终是否有提交订单等。将这些数据串起来则可以还原用户当时的场景,剖析出用户的真实需求。此时,产品需要思考当前的产品是否满足了用户的需求,若是没有,如何改善。

2.活做数据,抓住数据的相关性

“活”做数据收集,从相关联的行业和业务中去收集能够为现在所用的数据。如,负责特价酒店的产品,可以收集这批用户在火车票、特价机票及门票等相关业务,从而获得不一样的启发。

3.数据分类,找到核心数据

不同的数据含金量不同,即使同样数据在不同的场景体现出不同的价值,具体分类可以参考以下:

(1)不可再生和可再生;

(2)基础、中间层和应用层

(3)按数据业务归属,分为各个数据主体

(4)隐私数据和非隐私数据

4.个人数据管理

(1)收集有效的数据源,并按重要性和时间长短进行分类;

(2)关键词标签是对数据收集后重要的整理



stata SPSS
macc891207 学生认证  发表于 2018-12-7 18:30:57 |显示全部楼层
不错,支持卤煮,楼主加油~~
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2018-12-15 11:23