首先,导入所需的程序包与示例数据:
- import numpy as np
- import pandas as pd
- # 运用 Pandas 包的功能函数将目标数据读取为 Numpy 数组,示例数据为一份2014年的降雨量数据
- rainfall = pd.read_csv('data/Seattle2014.csv')['PRCP'].values
- inches = rainfall / 254 # 单位转换:1/10mm -> inches
- inches.shape
可以看到,数据为一个长度为365的一维数组。接着,可以做一个分布直方图,以便于更直观的展示数组内容:
- %matplotlib inline
- import matplotlib.pyplot as plt
- import seaborn; seaborn.set() # 设置图表样式
- plt.hist(inches, 40);
数组对比
在具体分析上述数据前,先让我们了解一下数组对比的一些基本方法,如下所示:
构造如下一维数组:
- x = np.array([1, 2, 3, 4, 5])
我们可以通过以下控制符进行数组元素与特定实数的比较:
- x < 3 # 小于
- x > 3 # 大于
- x <= 3 # 小于等于
- x >= 3 # 大于等于
- x != 3 # 不等于
- x == 3 # 等于
通过构造代数式进行复杂的条件判断:
- (2 * x) == (x ** 2)
对于多维数组,上述方法同样有效:
- rng = np.random.RandomState(0)
- x = rng.randint(10, size=(3, 4))
- x
- x < 6
这样的对比判断不会影响到原始数组本身:
- print(x)
利用 Numpy 包中的相关函数,我们还可以对数组元素的情况进行综合的判断,进而回答一些更复杂的问题
以上内容转自 数析学院 ,后面还有很多内容,改天继续搬运



雷达卡









京公网安备 11010802022788号







