# 2018.05.19
# by pengxw
# Python3 数据结构
# 本章节我们主要结合前面所学的知识点来介绍Python数据结构。
# =============================================================================
# 列表
# =============================================================================
#
#
# Python中列表是可变的,这是它区别于字符串和元组的最重要的特点,一句话概括即:列表可以修改,而字符串和元组不能。
# 以下是 Python 中列表的方法:
# 方法 描述
# list.append(x) 把一个元素添加到列表的结尾,相当于 a[len(a):] = [x]。
# list.extend(L) 通过添加指定列表的所有元素来扩充列表,相当于 a[len(a):] = L。
# list.insert(i, x) 在指定位置插入一个元素。第一个参数是准备插入到其前面的那个元素的索引,例如 a.insert(0, x) 会插入到整个列表之前,而 a.insert(len(a), x) 相当于 a.append(x) 。
# list.remove(x) 删除列表中值为 x 的第一个元素。如果没有这样的元素,就会返回一个错误。
# list.pop([i]) 从列表的指定位置移除元素,并将其返回。如果没有指定索引,a.pop()返回最后一个元素。元素随即从列表中被移除。(方法中 i 两边的方括号表示这个参数是可选的,而不是要求你输入一对方括号,你会经常在 Python 库参考手册中遇到这样的标记。)
# list.clear() 移除列表中的所有项,等于del a[:]。
# list.index(x) 返回列表中第一个值为 x 的元素的索引。如果没有匹配的元素就会返回一个错误。
# list.count(x) 返回 x 在列表中出现的次数。
# list.sort() 对列表中的元素进行排序。
# list.reverse() 倒排列表中的元素。
# list.copy() 返回列表的浅复制,等于a[:]。
temp_list = [1,2,3,4,5,4,3,2,1,0]
# 对元素计数
print(temp_list.count(0), temp_list.count(2))
# 在index=3的位置插入元素-5
temp_list.insert(3,-5)
# 在列表末尾添加元素 -10
temp_list.append(-10)
# 输出元素第一次出现的索引index
temp_list.index(4)
# 移除第一次出现的该元素
temp_list.remove(2)
# 对元素倒排序
temp_list.reverse()
# 对元素排序
temp_list.sort()
# 将列表当做堆栈使用
# 列表方法使得列表可以很方便的作为一个堆栈来使用,堆栈作为特定的数据结构,最先进入的元素最后一个被释放(后进先出)。
# 用 append() 方法可以把一个元素添加到堆栈顶。用不指定索引的 pop() 方法可以把一个元素从堆栈顶释放出来。
stack = [3,4,5]
stack.append(6)
stack.append(7)
stack.pop()
stack.pop()
# 将列表当作队列使用
# 也可以把列表当做队列用,只是在队列里第一加入的元素,第一个取出来;但是拿列表用作这样的目的效率不高。
# 在列表的最后添加或者弹出元素速度快,然而在列表里插入或者从头部弹出速度却不快(因为所有其他的元素都得一个一个地移动)。
# 导入deque函数
from collections import deque
stack = deque([3,4,5]) # deque()里参数为迭代器
stack.append(6)
stack.append(7)
stack.popleft() # 列表对象无popleft函数
# 列表推导式
# 列表推导式提供了从序列创建列表的简单途径。通常应用程序将一些操作应用于某个序列的每个元素,
# 用其获得的结果作为生成新列表的元素,或者根据确定的判定条件创建子序列。
# 每个列表推导式都在 for 之后跟一个表达式,然后有零到多个 for 或 if 子句。
# 返回结果是一个根据表达从其后的 for 和 if 上下文环境中生成出来的列表。如果希望表达式推导出一个元组,就必须使用括号。
# 这里我们将列表中每个数值乘三,获得一个新的列表
vec = [2, 4, 6]
[3*x for x in vec]
# Out[31]: [6, 12, 18]
[[x, x**2] for x in vec]
# Out[32]: [[2, 4], [4, 16], [6, 36]]
# 这里我们对序列里每一个元素逐个调用某方法:
freshfruit = [' banana', ' loganberry', 'passion fruit ']
[weapon.strip() for weapon in freshfruit]
# ['banana', 'loganberry', 'passion fruit']
# 我们可以用 if 子句作为过滤器
[3*x for x in vec if x>3]
# Out[37]: [12, 18]
# 以下是一些关于循环和其它技巧的演示
vec1 = [2, 4, 6]
vec2 = [3, 5, 7]
[x*y for x in vec1 for y in vec2]
# Out[38]: [6, 10, 14, 12, 20, 28, 18, 30, 42]
[vec1[i]*vec2[i] for i in range(len(vec1))]
# Out[39]: [6, 20, 42]
# 列表推导式可以使用复杂表达式或嵌套函数
[str(round(355/113, i)) for i in range(1, 6)]
# Out[40]: ['3.1', '3.14', '3.142', '3.1416', '3.14159']
# 列表推导式的执行顺序:各语句之间是嵌套关系,左边第二个语句是最外层,依次往右进一层,左边#第一条语句是最后一层。
[x*y for x in range(1,5) if x>3 for y in range(-2,3) if y<2]
# Out[48]: [-8, -4, 0, 4]
# 他的执行顺序是
for x in range(1,5):
if x >3:
for y in range(-2,3):
if y<2:
x*y
print(x, y, x*y)
matrix = [[1,2,3,4],
[5,6,7,8],
[9,10,11,12]]
# 嵌套列表解析
# Python的列表还可以嵌套。
# 以下实例展示了3X4的矩阵列表
[[row[i] for row in matrix] for i in range(4)]
# Out[11]: [[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
for row in matrix:
print(row)
# [1, 2, 3, 4]
# [5, 6, 7, 8]
# [9, 10, 11, 12]
# 另外一种实现方法:
transposed = []
for i in range(4):
# the following 3 lines implement the nested listcomp
transposed_row = []
for row in matrix:
transposed_row.append(row[i])
transposed.append(transposed_row)
transposed
# Out[15]: [[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
# del 语句
# 使用 del 语句可以从一个列表中依索引而不是值来删除一个元素。这与使用 pop() 返回一个值不同。
# 可以用 del 语句从列表中删除一个切割,或清空整个列表(我们以前介绍的方法是给该切割赋一个空列表)。例如:
vec1 = [2, 4, 6, 8, 10]
del vec1[0]
vec1
del vec1[2:3]
vec1
# [4, 6, 10]
del vec1[:]
vec1
# []
# 也可以用 del 删除实体变量:
del vec1
# =============================================================================
# 元组和序列
# =============================================================================
#
# 元组由若干逗号分隔的值组成,元组在输出时总是有括号的,以便于正确表达嵌套结构。
# 在输入时可能有或没有括号, 不过括号通常是必须的(如果元组是更大的表达式的一部分)。
t = 345, 678, 123, 'hello'
t[0]
# 345
u = t,(1,2,3,4)
u
# ((345, 678, 123, 'hello'), (1, 2, 3, 4))
# 元组不可变,若元组的成员可变类型,则成员可编辑。
a, b, c = [1,2,3,4], [5,6,7,8], [9,10,11,12]
t = a, b, c
print(t)
# ([1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12])
del b[1:3]
print(t)
# ([1, 2, 3, 4], [5, 8], [9, 10, 11, 12])
# =============================================================================
# 集合
# =============================================================================
#
# 集合是一个无序不重复元素的集。基本功能包括关系测试和消除重复元素。
# 可以用大括号({})创建集合。注意:如果要创建一个空集合,你必须用 set() 而不是 {} ;后者创建一个空的字典
# ,下一节我们会介绍这个数据结构。以下是一个简单的演示:
basket = {'apple', 'orange', 'apple', 'pear'}
print(basket)
# {'apple', 'pear', 'orange'}
'orange' in basket
a = set('apple')
b = set('pear')
a # a中唯一的字母
# Out[29]: {'a', 'e', 'l', 'p'}
b # b中唯一的字母
# Out[30]: {'a', 'e', 'p', 'r'}
a - b # 在a中不在b中
# Out[31]: {'l'}
a | b # 在a或b中
# Out[32]: {'a', 'e', 'l', 'p', 'r'}
a & b # 在a且在b中
# Out[33]: {'a', 'e', 'p'}
a ^ b # 异或,在a或b的字母但不同时在a和b中
# Out[34]: {'l', 'r'}
# 集合也支持推导式,元组不支持:
a = {x for x in 'shawn' if x not in 'abc'}
a
# Out[36]: {'h', 'n', 's', 'w'}
# =============================================================================
# 字典
# =============================================================================
#
# 另一个非常有用的 Python 内建数据类型是字典。
# 序列是以连续的整数为索引,与此不同的是,字典以关键字为索引,关键字可以是任意不可变类型,通常用字符串或数值。
# 理解字典的最佳方式是把它看做无序的键=>值对集合。在同一个字典之内,关键字必须是互不相同。
# 一对大括号创建一个空的字典:{}。
contactor = {'name':'shawn', 'age':27, 'gender':'male'}
list(contactor.keys())
# Out[49]: ['name', 'age', 'gender']
{x: x**2 for x in (1,2,3,4,5)}
# Out[50]: {1: 1, 2: 4, 3: 9, 4: 16, 5: 25}
# 构造函数 dict() 直接从键值对元组列表中构建字典。如果有固定的模式,列表推导式指定特定的键值对:
dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
# Out[51]: {'guido': 4127, 'jack': 4098, 'sape': 4139}
# 如果关键字只是简单的字符串,使用关键字参数指定键值对有时候更方便:
dict(sape=4139, guido=4127, jack=4098)
# Out[52]: {'guido': 4127, 'jack': 4098, 'sape': 4139}
# =============================================================================
# 遍历技巧
# =============================================================================
#
# 在字典中遍历时,关键字和对应的值可以使用 items() 方法同时解读出来:
dict1 = dict(sape=4139, guido=4127, jack=4098)
for k, v in dict1.items():
print(k, v)
# sape 4139
# guido 4127
# jack 4098
# 在序列中遍历时,索引位置和对应值可以使用 enumerate() 函数同时得到:
for k, v in enumerate(['shawn', 27, 'male']):
print(k, v)
# 0 shawn
# 1 27
# 2 male
# 同时遍历两个或更多的序列,可以使用 zip() 组合:
questions = ['name', 'favorite color', 'gender']
answers = ['shawn', 'blue', 'male']
for q, a in zip(questions, answers):
print('What is your {0}? It is {1}.'.format(q,a))
# What is your name? It is shawn.
# What is your favorite color? It is blue.
# What is your gender? It is male.
# 有多个列表需要遍历时,需要zip,除了用'{0}{1}'.format(q,a)的方法,还可以使用%s方法(两者效果一样一样的)
questions = ['name', 'favorite color', 'gender']
answers = ['shawn', 'blue', 'male']
for q, a in zip(questions, answers):
print('What is your {0}? It is {1}.'.format(q,a))
print('what is your %s? it is %s.' %(q,a))
# What is your name? It is shawn.
# what is your name? it is shawn.
# What is your favorite color? It is blue.
# what is your favorite color? it is blue.
# What is your gender? It is male.
# what is your gender? it is male.
# 要反向遍历一个序列,首先指定这个序列,然后调用 reversed() 函数:
for i in reversed(range(1, 10, 2)):
print(i)
# 9
# 7
# 5
# 3
# 1
# 要按顺序遍历一个序列,使用 sorted() 函数返回一个已排序的序列,并不修改原值:
basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
for f in sorted(set(basket)):
print(f)
# apple
# banana
# orange
# pear
print(basket)
# ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
|