985 0

[作业] 大数据时代论文 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

学前班

40%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
20 点
帖子
1
精华
0
在线时间
0 小时
注册时间
2018-11-27
最后登录
2018-11-27

本可爱很可爱 发表于 2018-11-27 22:34:08 |显示全部楼层
摘  要

大数据时代已然来临。通过阅读《大数据时代》,我们能更加深刻地意识到这一点。维克托·迈尔-舍恩伯格作为知名的数据科学家,其在信息领域的研究成果斐然,且在商业领域做出卓越贡献。他对大数据时代的有着清楚的见地,使得这本书能让读者明确大数据时代的概念并形成自己的认识,得以预估自己未来的发展及自身需做出的改变好来应对社会需求。此篇论文实则为读后感,旨在阐述作者本人从书中得到的认识,具有现实参考意义。

关键字:大数据时代 维克托·迈尔-舍恩伯格 读后感

前  言

随着计算机技术的突破,我们显然迎来了大数据时代。我们的行为、位置,甚至身体生理数据等每一点变化通过我们使用过的电子设备都成为了可被记录和分析的数据。基于这些数据之上,人们研发出越来越多智能化的应用。仿若心有灵犀,你打开的软件知道你喜欢什么,你适合什么,甚至可以给你提建议(相信每个因为淘宝首页推荐多花了不少钱的人点都深有同感)近些日子来,支付宝推出运用大数据统计分析的年度账单成了新时尚,刷爆了朋友圈,类似的还有网易云音乐、QQ音乐等软件推出年度总结。然而就在大家竞相转发调侃之时,并没有察觉到个人数据信息已然悄无声息地落入他人掌控之中。相比于2012年,如今的电子设备显然上升了一个大台阶。庞大的人群和应用市场,复杂性高、充满变化,使得中国成为世界上最复杂的大数据国家。基于此,大数据已经正在潜移默化地影响我们的生活,以致于我们无法再对它视而不见。

在《大数据时代》中,维克托·迈尔·舍恩伯格前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。

维克托最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。

尽管是2012年出版的书籍,许多观点相对于现今已经有所改变,但作者的观点对我们认识大数据时代仍十分有价值。本书的译者周涛教授是我国最年轻有为的大数据专家。

第一章 作者及背景1.1 作者简介

维克托·迈尔-舍恩伯格是研究数据科学的技术权威,是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。他曾先后任教于世界最著名的几大互联网研究学府。现任牛津大学网络学院互联网治理与监管专业教授。

他的学术成果斐然,有一百多篇论文公开发表在《科学》《自然》等著名学术期刊上,他同时也是哈佛大学出版社、麻省理工出版社、通信政策期刊、美国社会学期刊等多家出版机构的特约评论员。

他是备受众多世界知名企业信赖的信息权威与顾问。他的咨询客户包括微软、惠普和IBM等全球顶级企业;而他自己早在1986年与1995年就担任两家软件公司的总裁兼CEO,由他的公司开发的病毒通用程序,成为当时奥地利最畅销的软件产品。

他也是众多机构和国家政府高层的信息政策智囊。他一直专注于信息安全与信息政策与战略的研究,是欧盟专家之一,也是世界经济论坛、马歇尔计划基金会等重要机构的咨询顾问,同时他以大数据的全球视野,熟悉亚洲信息产业的发展与战略布局,先后担任新加坡商务部高层、文莱国防部高层、科威特商务部高层、迪拜及中东政府高层的咨询顾问。所著《大数据时代》一书是开国外大数据系统研究的先河之作。

1.2 背景简介

进入2012年,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。它已经上过《纽约时报》《华尔街日报》的专栏封面,进入美国白宫官网的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的国金证券、国泰君安、银河证券等写进了投资推荐报告。

数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然很多企业可能并没有意识到数据爆炸性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识到数据对企业的重要性。

正如《纽约时报》20122月的一篇专栏中所称,"大数据"时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。

哈佛大学社会学教授加里·金说:"这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。"

第二章 主要内容

2.1 主要观点

在《大数据时代》里,作者维克托·迈尔-舍恩伯格从三部分阐述了在大数据时代里生活、工作与思维发生的变革。阅读本书后,我认为作者的主要观点在于第一部分“大数据时代的思想变革”。因为作者提出,在以前,一旦完成收集数据的目的之后,数据就会被认为已经没有用处了,而在大数据时代,数据的价值会再次甚至多次被挖掘出来,你永远不知道这些数据下一秒会发挥什么样的作用。信息不再是孤立存在着,而是被网络相互联结着,牵一发则动全身。

在这章中,作者详尽地说明了人们需要改变的三个思维。

第一个思维变革:样本=总体。我们要利用所有的数据,而不再仅仅依靠部分数据,即不是选择随机样本,而是接受全体数据。在过去漫长的历史长河中,由于技术问题,人们无法收集、储存和分析大量的数据。然而总有一些问题的解决需要使用大量数据信息,例如人口普查,这导致国家需要花费许多人力物力去完成这件事。因而有科学家发明了随机抽样,用部分代替总体的方法来预估总体的情况。这是一种治标不治本的方法,因为他会忽略部分因素且有时无法保证条件全部吻合(例如信息匮乏)以致于准确率降低。如今随着科学的发展,通过网络,我们的数据不断地产生,甚至出现信息爆炸,芯片存储空间的单位从MB到GB再到TB甚至更大,计算机处理数据的能力更是急速提高,这就使得我们能够处理足够多的数据而不用去担心其准确率的问题。基于此,我们甚至出现了由于信息过多超过了我们接受能力而产生焦虑问题。因此在这个时代,我们不需要担心数据的数量和质量问题,只有把数据全部或是尽可能地集合起来,它才会发挥出它最大的价值。

第二个思维变革:我们唯有接受不精确性,才有机会打开一扇新的世界之窗,即相对于精确性,我们应更重视数据的混杂性。过去科技的落后使得人们对收集到的数据十分珍视,务必使它精确来保证结果的正确性。然而这在大部分时候是相当困难的,数据的使用者需要付出许多努力来多次验证它的精确性,这是时代无法规避的结果。然而在大数据时代,我们看到的不是信息的匮乏,而是信息如此之多以致于我们无法抉择。随着科学的发展,我们都发现了哪怕是一个微小的现象,其导致因素也极有可能是复杂多样的。如果非要先保证数据的精确性,会浪费很多不必要的精力,这在讲求效率的年代里是不被允许的。相反,如果让数据具有混杂性,不仅能够得出正确率更高的结果,还能发现许多“意外之喜”。

第三个思维变革:不是所有的事情都必须知道现象背后的原因,而是要让数据自己“发声”,即不去探究数据的因果关系,而是相关关系。作者提到,由于数据的混杂性及其它因素,我们很难去深究每次数据决策背后的原因是什么,即我们很难去探究“为什么”,因而我们要把精力放在“是什么”上,来创造出数据更多的应用。在这一点我是不同意作者的,因为一旦我们放弃追求因果,我们无可避免会陷入计算机思维,变得无法真正思考(我觉得计算机思维即“创造再创造,无用即废弃,没有最好只有更好”,但从我们会开口讲话时,我们思考时的最大特点是会问“为什么”,而不仅仅是“是什么”)。当数据的处理技术发生翻天覆地的变化时,大数据时代,我们的思维也要变革。这是时代的要求,但我们也要思考,哪些是可以改变的,哪些是我们不可放弃的。

2.2 本书特点

《大数据时代》2012版译者周涛所作的序总结得很好:

一是观点掷地有声。作者提出的观点并不全是符合主流的,但有理有据,使人信服,全文条理清晰,结构明确,令读者读完仍能记住他的观点并思考其观点与自己的认知有何不同之处,进而提升自己的理解。

二是观念高屋建瓴。作者通过其丰富的人生阅历,试图从很多实例和经验中总结出普适性观点,而不仅限定于特殊案例。这就使得这本书有了更高的学术价值而不仅仅是科普。

三是例子丰富翔实。短短141页的篇幅包含了上百个学业和商业的实例,观点与案例的结合使读者能更轻松地理解作者的意图。

从这三点来看,这本书体现出作者本人的深厚内涵以及内容的可读性,作为教材的参考书无疑对学生有良好的帮助。

第三章 问题提出

3.1 什么是数据

用计算机专业术语来讲,数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的的原始素材。它可以是连续的值,比如声音、图像,称为模拟数据。也可以是离散的,如符号、文字,称为数字数据。在计算机系统中,数据以二进制信息单元0,1的形式表示。在《大数据时代》,数据则一般指指所有能输入到计算机并被计算机程序处理的符号的介质的总称。现在计算机存储和处理的对象十分广泛,表示这些对象的数据也随之变得越来越复杂。

3.2 什么是大数据

IT行业专业术语中,大数据(big data)指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。作者指出,“大数据”这个概念是指需要处理的信息量过大,已经超出一般电脑在处理数据时所能使用的最大内存量,因此工程师必须改进处理数据的工具。

3.3 大数据由何产生

不仅是交易系统和业务系统产生的数据,终端(电脑、手机等),尤其是个人各种流水操作,例如购买物品清单,上网浏览历史,照片,微博等,我们的一言一行一举一动皆是数据。大数据时代里,科技公司、国家等关注这些大量的数据,通过分析这些数据来发现价值。

3.4未来有哪些发展趋势

由于我们对数据的依赖逐年加深,其发展趋势必有好坏多面共同存在。

趋势一:数据的资源化。资源化,指大数据成为企业和社会关注的重要战略资源,并已成为大家争相抢夺的新焦点。书中提到一个例子,2012Facebook上市前预估资产上千亿,上市后却骤然减少以致于股价下跌,原因在于把数据资源作为资产的一部分,而社会还没有明文规定数据资源价值大小的预估方式。但近年数据资源的重要性我们有目共睹。

趋势二:与云计算的深度结合。大数据离不开云处理,云处理为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一。自2013年开始,大数据技术已开始和云计算技术紧密结合,我们可以预见未来两者关系将更为密切。

趋势三:科学理论的突破。随着大数据的快速发展,就像计算机和互联网一样,大数据正在引发新一轮的技术革命。随之兴起的数据挖掘、机器学习和人工智能等相关技术,可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。

趋势四:数据科学和数据联盟的成立。未来,数据科学将成为一门专门的学科,被越来越多的人所认知。各大高校将设立专门的数据科学类专业,也会催生一批与之相关的新的就业岗位。与此同时,基于数据这个基础平台,也将建立起跨领域的数据共享平台。共享极有可能是未来的主题之一。


第四章 未来发展

4.1对数据的认识

通过阅读本书以及资料查询,数据对我而言不再仅是电脑里的一串串数字,而是一切能被电子设备记录到的信息。哪怕你身上没有携带或使用过任何电子设备,然而你的信息仍然会被收集到,就好比谷歌街探车就有可能记录你的住处,店口的监视器会记录你每天路过这里的次数……我们生活在一个数据化的大数据时代。

4.2大数据时代对自身发展的影响

很多时候,数据比我们本人更了解自己。当我们打开淘宝,它会推荐你某样产品更新或是正在打折;你打开网易云音乐,它会推荐你喜欢的歌单的类似歌单;你的花呗会随着你良好的信用保持记录逐步提升额度……我们通过各种能力测试来了解自己,来获得某个offer,或是来进一步完善自己,甚至我们通过数字分析来决定自己上哪一所大学。

更多时候,社会通过数据来认识你。银行通过查询你的信用记录、消费记录和资产来决定你能不能贷款;你的简历资料在网络里都有迹可循;你的病历随时可以在各个医院里调用……

同时,数据应用的智能化,使得我们获取信息的能力大幅提高,这就使得我们在获取信息的同时要提高我们筛选、整合信息的能力。

更重要的是,大数据时代促使我们需要进行思维的转变。固步自封在这个时代是致命的,学习是我们大多数人跟进时代唯一的方法。一旦松懈,我们就有可能被时代淘汰;一旦眼光局限,我们就可能会因为信息疏漏而犯下错误。

4.3 应对需求应作出的改变

我们无法改变世界,我们只能改变自己。大数据时代,由于信息更迭和技术更新的速度十分快速,因此不可避免的要求人们有更敏捷的反应速度,更敏锐的眼光,更包容的心态和更严谨的态度。我们需要学会综合各种信息,并学会不对信息妄下判断,同时坚定我们对这个世界的热爱,即我们爱这个世界,不是因为它可以被量化,而是因为它的原始性和生命力。

针对这些观点,我认为我们需要做出以下改变:一是提高自己的信息统合能力,二是保持信息的更新,三是学会零散学习,即培养自己一专多精的能力。

结   论

在大数据时代,我们应该要做的是使用数据,做数据的主宰者,而不是被数据控制。如何避免发生类似《1984》或《美丽新世界》里面的场景,是我们需要思考的问题。大数据已然成为这个时代的中心,它的力量就目前来讲是无法撼动的,我们能做的是要保持自己的本心。这是我读完这本书的最大的感受。


参考文献

《大数据时代》维克托·迈尔·舍恩伯格



您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2018-12-15 11:26