以下内容转自 数析学院,只节选了部分,有需要的同学可以直接查看原文
Where‘s Waldo》是由英国插画家Martin Handford创作的一系列儿童书籍,该书包括一系列详细的双面插画图,描述了许多人在给定位置做许多有趣的故事。该书要求读者找到其中一个叫做 Waldo 的人,穿着独特的红白条纹衬衫,戴着摇摇晃晃的帽子以及眼镜,使得他较为容易辨认,但是在插图中包含着许多欺骗性元素。能不能通过数据分析的方法规划出一条寻找 Waldo 的最佳路径呢?本节将带您一起探索这个问题。
1、将数据导入 pandas DataFrame
- from __future__ import print_function
- %matplotlib inline
- import matplotlib.pyplot as plt
- import numpy as np
- import pandas as pd
- import seaborn as sb
- import random
- import math
- sb.set_style("white")
- #plt.style.use("tableau10")
- wheres_waldo_locations = pd.read_csv
- ("wheres-waldo-locations.csv")
- #使用pandas载入数据
- wheres_waldo_locations.describe()
- #对数据进行快速统计汇总
- wheres_waldo_locations.head()
2、根据book列绘制散点图
根据book列绘制所有点。中心的虚线代表了book列的折痕,因为《Where‘s Waldo》插图总是延续两个页面。
- plt.figure(figsize=(12.75, 8))
- plt.plot([6.375, 6.375], [0, 8], "--", color="black", alpha=0.4, lw=1.25)
- for book, group in wheres_waldo_locations.groupby("Book"):
- plt.plot(group.X, group.Y, "o", label="Book %d" % (book))
- plt.xlim(0, 12.75)
- plt.ylim(0, 8)
- plt.xticks([])
- plt.yticks([])
- plt.legend(loc="upper center", ncol=7, frameon=True, fancybox=True, bbox_
- to_anchor=(0.5, 1.1));
以上内容转自 数析学院,如需完整内容可以直接查看原文


雷达卡




京公网安备 11010802022788号







