- import numpy as np
- import pandas as pd
在 Python 中,特殊的常量 None 通常被理解为缺失值的一种,我们构建了一个包含有 None 的 Numpy 数组 vals1:
- vals1 = np.array([1, None, 3, 4])
- vals1
- for dtype in ['object', 'int']:
- print("dtype =", dtype)
- %timeit np.arange(1E6, dtype=dtype).sum()
- print()
- vals1.sum()
可以看到,当我们的数组中存在缺失值 None 时,我们无法完成简单的求和运算,并且会出现程序报错。
运用 Numpy 库,我们可以用另一种方式生成缺失值,即使用 np.nan:
- vals2 = np.array([1, np.nan, 3, 4])
- vals2.dtype
- 1 + np.nan
- 0 * np.nan
可以发现,np.nan 虽然也不能参与简单的计算,但不会出现程序报错的情况,我们得到的结果将为 nan。
同时,Numpy 库还专门为我们准备了用于处理 nan 值的特殊函数 nansum、nanmin 以及 nanmax 等:
- vals2.sum(), vals2.min(), vals2.max()
- np.nansum(vals2), np.nanmin(vals2), np.nanmax(vals2)
在 Pandas 序列中,不论我们生成的缺失值是 None 还是 nan,都会被转化为 NaN 的形式:
- pd.Series([1, np.nan, 2, None])
以上内容转自 数析学院,原文内容较多,这里只是一部分,感兴趣的同学可以直接查看原文


雷达卡




京公网安备 11010802022788号







