- 阅读权限
- 255
- 威望
- 0 级
- 论坛币
- 96 个
- 通用积分
- 2.0091
- 学术水平
- 2 点
- 热心指数
- 15 点
- 信用等级
- 2 点
- 经验
- 11502 点
- 帖子
- 278
- 精华
- 0
- 在线时间
- 94 小时
- 注册时间
- 2016-11-22
- 最后登录
- 2022-5-2
博士生
还不是VIP/贵宾
- 威望
- 0 级
- 论坛币
- 96 个
- 通用积分
- 2.0091
- 学术水平
- 2 点
- 热心指数
- 15 点
- 信用等级
- 2 点
- 经验
- 11502 点
- 帖子
- 278
- 精华
- 0
- 在线时间
- 94 小时
- 注册时间
- 2016-11-22
- 最后登录
- 2022-5-2
| 开心 2018-2-2 10:54:36 |
---|
签到天数: 143 天 连续签到: 2 天 [LV.7]常住居民III
|
相似文件
换一批
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
Pandas 库对象的相关特性能够帮助我们很方便的达成一些列运算的结果,首先导入 Pandas 库和 Numpy 库
- import pandas as pd
- import numpy as np
复制代码 构造一个由4个十以内随机整数组成的 Pandas 序列和一个由十以内随机整数组成的3x4数据框:
- rng = np.random.RandomState(42)
- ser = pd.Series(rng.randint(0, 10, 4))
- ser
复制代码
- df = pd.DataFrame(rng.randint(0, 10, (3, 4)),
- columns=['A', 'B', 'C', 'D'])
- df
复制代码
可以看到,运用 Numpy 中的函数可以对 Pandas 对象中的元素进行复杂地运算:
接着,我们构造两个带有指定序号名的 Pandas 序列,如下所示:
- area = pd.Series({'Alaska': 1723337, 'Texas': 695662,
- 'California': 423967}, name='area')
- population = pd.Series({'California': 38332521, 'Texas': 26448193,
- 'New York': 19651127}, name='population')
复制代码 我们可以将这两个序列相除,得到的结果序列中包含了所有在两个序列中出现过的序号名。需要注意的是,结果序列中只有在两个序列都存在的序号对应的位置上才有正确的计算结果,其余的为缺省值NaN:
- area.index | population.index
复制代码
当使用加号对两个 Pandas 序列进行相加运算时,我们得到的结果与上面相除结果类似——若对应的序号并非同时存在于两个序列中,则返回的值为NaN:
- A = pd.Series([2, 4, 6], index=[0, 1, 2])
- B = pd.Series([1, 3, 5], index=[1, 2, 3])
- A + B
复制代码
对于这种情况,我们可以运用 add 函数来完成相加并解决缺省值的问题——将参数 fill_value 的值设置为0,这样空缺序号对应的元素在计算时将会自动由0填补:
以上内容转自 数析学院 ,感兴趣的同学可以访问原文学习后续更多内容
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|
|
|