- import numpy as np
- import pandas as pd
序列是 Pandas 中的重要对象之一,通过 Series 函数我们可以将列表转换为一个序列对象。
- data = pd.Series([0.25, 0.5, 0.75, 1.0])
- data
values 和 index 是序列的两个重要属性,其中 values 属性为序列中的元素数值:
- data.values
index 则为序列中元素的序号序列:
- data.index
我们可以通过 index 中的元素值来对序列的 values 进行索引:
- data[1]
- data[1:3]
index 中的元素不局限于数字,也可以是字符串:
- data = pd.Series([0.25, 0.5, 0.75, 1.0],
- index=['a', 'b', 'c', 'd'])
- data
- data['b']
也无需符合任何的递推规律:
- data = pd.Series([0.25, 0.5, 0.75, 1.0],
- index=[2, 5, 3, 7])
- data
- data[5]
Series 函数还可以将 Python 中的字典变量转化为序列对象,在这种情况下序列中的 index 和 values 将会自适应于字典中的内容,例如我们现在构建一个表示各城市人口数据的字典,并将其转化为序列对象:
- population_dict = {'California': 38332521,
- 'Texas': 26448193,
- 'New York': 19651127,
- 'Florida': 19552860,
- 'Illinois': 12882135}
- population = pd.Series(population_dict)
- population
以上内容转自数析学院,更多关于数据框和索引项的内容可以访问原文查看