请选择 进入手机版 | 继续访问电脑版
楼主: 东方祥
1881 5

[问答] 大数据思维与数据可视化(初级)课外补充资料 [推广有奖]

学科带头人

56%

还不是VIP/贵宾

-

威望
2
论坛币
653784 个
通用积分
46542.3897
学术水平
203 点
热心指数
253 点
信用等级
195 点
经验
53746 点
帖子
520
精华
6
在线时间
2288 小时
注册时间
2015-3-25
最后登录
2024-3-20

东方祥 企业认证  发表于 2018-11-28 10:08:20 |显示全部楼层 |坛友微信交流群
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

大数据思维与数据可视化(初级)实验数据集

data.zip (150.38 KB)

虽然数据可视化通常会让人联想到商业智能与西装革履的分析师,但它通常比您所想象的更具创意并且丰富多彩。从业务仪表板、公共健康可视化到流行文化趋势分析,数据可视化涵盖了广泛多样的应用情景。要制作精美优质的数据可视化,除了需要出色的分析能力之外,还需要具备设计图形和讲述故事的技能。


在本文中,我们将着重介绍一些最具影响力、趣味性和启发性的可视化。我们先来浏览历史上一些著名的示例,然后让时间快进,讨论一些更加现代的可视化。


1. 拿破仑远征地图
1_napolean_minard.png


1812 年,拿破仑进军莫斯科,企图征服这座城市。这成为了一场灾难:大军出征时共有约 47 万名士兵,而到了兵败还乡时则仅剩一万人。这张图表讲述了关于这场战役的故事,并成为了有史以来最著名的可视化作品之一。


这幅地图详细地描述了拿破仑大军的出征与败退。线条的宽度代表士兵总数,颜色代表移动方向(黄色表示进军莫斯科的方向,黑色表示回程的方向)。在中心的可视化下方还绘制了一张简单的温度曲线图,用来展示寒冬气温骤降的情况。这张图表有力而详尽地描绘出了一副震撼人心的大溃败场景。

由于名气颇大,这张图表受到了诸多批判性评论Excelcharts.com 的这篇文章就是一个很好的例子。其中很多都是合理的批评,但它仍然是一张极具影响力且成功的图表,它的特色是为每个数据点赋予丰富的细节,在此基础上讲述故事,激发人们的好奇心。


2.  1854 年宽街霍乱爆发事件地图
2_snow-cholera-map.jpg

可视化作者:John Snow

[color=rgb(0, 51, 153) !important]John Snow(不是《权力的游戏》里的 Jon Snow)霍乱地图本质上是一张早期的点图可视化。图中在城市街区内用小条形图标记出了伦敦每个家庭中死于霍乱的人数。这些条形图的集中程度和长度反映出城市街区的特定集合,旨在试图查明这些地区的死亡率高于其他地区的原因。调查结果显示:霍乱感染者人数最多的家庭所使用的饮用水均来自同一口水井。这在当时是一则发人深省的启示。这口水井已经被污水所污染,但霍乱疫情集中爆发的区域都在使用这口问题水井。在研究伦敦霍乱爆发事件更为广泛的趋势时,这一发现帮助人们认识到,霍乱疾病与受污染的水井之间存在相关性。那么,预防霍乱的办法就是建立排污系统并保护水井不受污染。

这张图揭示了问题的根本原因并启发人们找到了解决方案,正因如此,它成为了一个非常成功的可视化。另外,在那个点图和热图还没有完全开创的年代,这种早期的尝试可谓极具创新。正因为分析师扩宽了可视化技术的边界,从而创造出有用的新形式,才得以发现这一解决方案。

3. 克里米亚战争中的死亡原因


3_nightingale-mortality.jpg

可视化作者:Florence Nightingale
了解更多信息:[color=rgb(0, 51, 153) !important]维基百科

在 19 世纪 50 年代的克里米亚战争期间,士兵的死亡率很高并且在不断上升。但造成死亡的原因并不仅仅是战斗。护士、分析师兼数据专家 Florence Nightingale 利用这个精美的数据可视化,揭示出大多数死亡实际上是由槽糕的医疗措施造成的。螺旋图表中的阴影部分表示死亡总数,其中深色部分表示因战斗造成的死亡人数。人们能够一目了然地看出问题的背后另有原因,而且影响非常严重。Nightingale 的医疗专业知识和医护实践经验让她发现,士兵死亡大部分源于恶劣的医疗条件。这一原因令人惊讶,但可加以预防措施。

这项研究是英国皇家专门调查委员会对克里米亚战争中士兵死亡原因调查的一部分。Nightingale 与维多利亚时代的统计学先驱 William Farr 一起工作,后者并不支持采用可视化的想法,但 Nightingale 坚持自己的意见并积极推广这一现在已经非常著名的可视化。



4.新图说历史



4_a_new_chart_of_history_color.jpg


可视化作者:Joseph Priestley
了解更多信息:[color=rgb(0, 51, 153) !important]维基百科

用富于创造力的可视化方式,纵览人类文明已知历史中庞大而复杂的信息。

Joseph Priestly 凭借两张年代图表闻名于世。其一是“传记图”,图中描绘了 700 年历史中出现的著名男性人物、领袖和哲学家,让人一眼就能看到这段历史中活跃的男性名人尽管“传记图”内容简单,但仍是历史上最重要的可视化之一。

Priestly 在第二张年代图表中运用并发展了“传记图”中的技术,创作出了这幅“新图说历史”。这张年代图表与第一张图表类似,重点描绘了历史中同时存在的主要帝国和文明及其与影响。Priestly 对其技术进行了创新,不仅引入了颜色和大小,还创造性地使用了 Y 轴。最终造就了一副引人入胜的历史可视化故事,其中蕴含了丰富的信息。虽然这张图表看上去让人眼花缭乱,但它具有无穷的创造力,并且是当时年代下极具创新意义的原创作品。

5.交互式政府预算

5_2016_budget_visualization_safe_img.jpg


可视化作者:美国行政管理和预算局(2016 年)

众所周知,各国政府都会对政府预算进行模糊晦涩处理,使其难以理解,其中尤以美国政府为甚。白宫在巴拉克·奥巴马担任总统期间创建的这张树状图,利用可视化方式对美国 2016 年财政预算进行了细分,将政府计划公之于众。目前尚不清楚这是否是美国政府首次公开发布的交互式预算,但它至今仍可查阅并且具有启发性 - 尽管这只是一张非常普通的树状图。

让这一特殊可视化如此重要的原因是它的交付方式。这并非是最具创新性的树状图或者交互式可视化,也不是首个广为人知的政府预算可视化(《纽约时报》发表过令人惊艳的 2013 年财政预算可视化,另外总统候选人 Ross Perot 因其善用图表而著名)。关键之处在于,一个世界主要大国采用交互式数据可视化的方式来与它的纳税人进行沟通,向其告知他们缴纳的税款何去何从。通过简单明了的可视化,让这一复杂而晦涩的主题变得浅显易懂。

6.巴比伦后记

6_after_babylon.png


可视化作者:Density Design Lab

了解语言扩散的广度是无比艰难的 - 尤其在您不经常旅行或接触其他语言的情况下。我们知道世界上有很多种语言,但很难去消化理解这些语言的实际存在数量、使用区域、在全球的通行程度以及相互影响。

DensityDesign 的“巴比伦后记”项目使用“World Atlas of Language Structures”(世界语言结构地图集),将全世界的各种语言呈现在一系列交互式地图和图表中。其中囊括了所有 2678 种语言,并展示了它们的发源地、使用区域和使用者数量。甚至还解释了各种语言之间的关系,例如语系、外来词,以及不同语言之间的词语交换。


7.未来美国

7_pew_research_next_america.gif


可视化作者:Pew Research Center(皮尤研究中心)

Pew 的“未来美国”项目对美国的人口统计数据进行了全面的审视,并将其编制成一个庞大而美观的交互性数据可视化项目,由一些采用了直截了当的可视化的“章节”组成(上图展示了其中之一)。该项目展示了不断增长的种族多样化和跨种族婚姻趋势,为趋势线提供了历史背景,并对美国未来几十年可能发生的人口结构转变和变化情况进行了预测。

其中的亮点之一是用动画方式展示了年龄和性别人口细分金字塔。在几秒钟内,我们可以看到自 20 世纪 50 年代以来的人口结构转变情况。自那时以来,医疗干预和医疗保健让人们更加长寿,同时人口出生率自二战后的婴儿潮之后逐渐降低。随着时间的推移,年龄金字塔会变得逐渐接近一个矩形。

8.电影对白(按性别划分)

8_screenplay_dialogue_.png



Polygraph(又名 The Pudding)曾经因一项说唱歌词分类可视化而闻名,现在 Hanah Anderson 和 Matt Daniels 又通过可视化对电影史上 2000 部最热门电影的剧本进行分类,以此研究流行文化中的性别差异。他们计算每部电影中男性和女性角色的对白台词数量,结果不容乐观。

显然,几乎没有以女性为主导的动作片,但是如果审视所有电影种类的话,就会发现另一个事实:不同性别角色的台词数量严重失衡。该项目包含四个主要的可视化:一个专门展示迪斯尼电影的细分;一个对 2000 部电影剧本进行概述;一个提供简单的渐变控制条,允许用户搜索电影名称并使用几个主要筛选器;还有一个简要解读了电影台词中男女角色存在的年龄偏差。

除了对 2000 部电影剧本进行了令人敬佩的分析工作并展示出惊人的结果之外,该项目还因其毫无保留的透明度而著称:所用数据和研究方法都详细公开,并在项目本身中予以呈现。这种透明的做法受到了强烈的欢迎,但其增长趋势缓慢。

9.自拍之城

9_selfiecity.jpg


不要仅仅因为该项目是在分析自拍而不是研究如何预防霍乱就将其忽视。“自拍之城”站在广阔视角,以这一全球现象为背景对自拍数据进行了解读。通过分析来自世界各地的 12 万张自拍,研究人们进行自拍的方式。令人难以置信的是,这项研究的内容包罗万象,并且对自拍的方方面面进行了严谨的细分。我们能够从任何细节中发现趋势,可以按城市研究自拍者的头部倾斜状态或拍照姿势的趋势,或者按年龄和性别查看照片中出现微笑的频率。

自拍者往往都比较年轻,这一点可能并不会让您感到惊讶。但是,您可能会惊讶地发现,自拍并不像人们通常假设的那样千篇一律:与世界其他地方相比,圣保罗的女性在自拍时喜欢尽力去倾斜头部,而曼谷的女性则是喜欢微笑。随着社交媒体的影响在我们的生活中变得愈发根深蒂固,这一研究向我们展示了这种多样化全球现象的迷人之处。该网站还设置了一个交互式元素作为彩蛋,允许用户用独特的方式应用筛选器,来进一步探索自拍的世界。

10.每一次即将发生的日食(截至 2080 年)


10_eclipse_wash_po.gif


  可视化作者:Denise Lu

2017 年 8 月的日食是将近一个世纪以来发生的首次横跨美国东西两岸的日食。在这次日食之后,《华盛顿邮报》创建了一个交互式的地球可视化,用来显示此次日食的路径和 2080 年之前所有未来日食的路径。

旋转的地球上显示了日全食的路径(太阳完全被月亮遮挡的日食路径)、发生地点和发生时间(时间用深浅不一的阴影表示,并配以悬停文本工具提示)。如果您在网页中输入自己的出生年份,您将会了解到您的一生中还能看到多少次日食。


更多信息:http://edu.cda.cn/article/39




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:克里米亚战争 人口结构转变 数据可视化 可视化方式 数据可视 数据可视化

已有 2 人评分经验 论坛币 学术水平 收起 理由
cheetahfly + 100 + 2 精彩帖子
zhou_yl + 40 精彩帖子

总评分: 经验 + 100  论坛币 + 40  学术水平 + 2   查看全部评分

cheetahfly 在职认证  发表于 2018-11-30 08:29:41 |显示全部楼层 |坛友微信交流群
我个人的看法,还有几个伟大的可视化发明,但是由于大家司空见惯,因此反而不怎么留意了,我举两个例子,抛砖引玉:

2. K线图
将复杂的市场数据用非常精炼的形式展现出来,以此为基础衍生了复杂的技术分析体系。

1. 坐标系
将数值映射在二维或者三维空间中,直接推动了数学的进一步发展。

使用道具

东方祥 企业认证  发表于 2018-11-30 09:29:48 |显示全部楼层 |坛友微信交流群
cheetahfly 发表于 2018-11-30 08:29
我个人的看法,还有几个伟大的可视化发明,但是由于大家司空见惯,因此反而不怎么留意了,我举两个例子,抛 ...
K线发源于日本蜡烛图,坐标系联系了几何与代数,建立了数学的数形结合思想,这两点的确很常用

使用道具

啊哈来份牛大碗 发表于 2018-12-11 16:45:46 来自手机 |显示全部楼层 |坛友微信交流群
东方祥 发表于 2018-11-28 10:08
虽然数据可视化通常会让人联想到商业智能与西装革履的分析师,但它通常比您所想象的更具创意并且丰富多彩。 ...
谁有数据可视化方面的好书给大家分享一下呗

使用道具

东方祥 企业认证  发表于 2018-12-18 10:24:17 |显示全部楼层 |坛友微信交流群
啊哈来份牛大碗 发表于 2018-12-11 16:45
谁有数据可视化方面的好书给大家分享一下呗
https://bbs.pinggu.org/thread-6793625-1-1.html
数据可视化资源汇总(一):优秀书单、网站资源

使用道具

tianwk 发表于 2019-7-28 14:08:46 |显示全部楼层 |坛友微信交流群
thanks for sharing

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 18:02