0
点赞
收藏
分享

微信扫一扫

阿里云天池实验室Python学习笔记(二、数据结构)

代码小姐 2022-03-11 阅读 154

简介

本文为天池龙珠计划Python训练营的学习笔记,一为记录学习要点,避免日后遗忘;二为记录学习成果,督促学习;三为帮助有需要的小伙伴进行基础知识巩固参考。若有疑问或有错误的地方,欢迎指正留言。本部分主要为整理容器数据类型相关知识。

目录

简介

二、数据结构

1. 列表

(1)定义

(2)操作

2. 元组

(1)定义

(2)操作

3. 字符串

(1)定义

(2)切片与拼接

(3)内置方法

(4)字符串格式化

4. 字典

(1)定义

(2)创建和访问字典

(3)内置方法

5. 集合

(1)定义

(2)创建集合

(3)访问集合中的值

(4)内置方法

(5)集合的转换

(6)不可变集合

6. 序列

(1)定义

(2)针对序列的内置函数

7. 总结

(1)可变类型与不可变类型

(2)映射类型与序列类型


二、数据结构

1. 列表

(1)定义

列表是有序集合,能够保存任意数量任意类型的 Python 对象,利用方括号把所有元素绑定在一起,用逗号将元素分隔开。

注意,列表中所保存的是对象的指针。即使保存一个简单的[1,2,3],也有3个指针和3个整数对象。

(2)操作

创建列表

可直接创建,或用range()函数,或用推导式进行列表创建。

x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']
print(x, type(x))
# ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday'] <class 'list'>

x = list(range(1, 11, 2))
print(x, type(x))
# [1, 3, 5, 7, 9] <class 'list'>

x = [0 for i in range(5)]
print(x, type(x))
# [0, 0, 0, 0, 0] <class 'list'>

#创建混合列表
mix = [1, 'lsgo', 3.14, [1, 2, 3]]
print(mix, type(mix))  
# [1, 'lsgo', 3.14, [1, 2, 3]] <class 'list'>


#创建空列表
empty = []
print(empty, type(empty))  # [] <class 'list'>

添加元素

可直接创建,或用range()函数,或用推导式进行列表创建。

  • list.append(obj) 在列表末尾添加新的对象,只接受一个参数,参数可以是任何数据类型,被追加的元素在 list 中保持着原结构类型。
  • list.extend(seq) 在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表)

注意append()extend()的区别,举例如下:

#append
x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']
x.append(['Thursday', 'Sunday'])
print(x)  
# ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', ['Thursday', 'Sunday']]

print(len(x))  # 6


#extend
x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']
x.extend(['Thursday', 'Sunday'])
print(x)  
# ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Thursday', 'Sunday']

print(len(x))  # 7

删除元素

  • list.remove(obj) 移除列表中某个值的第一个匹配项,指定具体要删除的元素
  • list.pop([index=-1]) 移除列表中的一个元素(默认最后一个元素),并且返回该元素的值,指定一个索引
  • del var1[, var2 ……] 删除单个或多个对象。如果知道要删除的元素在列表中的位置,可使用del语句。
#remove
x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']
x.remove('Monday')
print(x)  # ['Tuesday', 'Wednesday', 'Thursday', 'Friday']

#pop
x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']
y = x.pop()
print(y)  # Friday

y = x.pop(0)
print(y)  # Monday

y = x.pop(-2)
print(y)  # Wednesday
print(x)  # ['Tuesday', 'Thursday']

#del
x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']
del x[0:2]
print(x)  # ['Wednesday', 'Thursday', 'Friday']

获取元素

通过元素的索引值,从列表获取单个元素,注意,列表索引值是从0开始的。通过将索引指定为-1,可让Python返回最后一个列表元素,索引 -2 返回倒数第二个列表元素,以此类推。

  • 单个元素:x[0],x[-2]
  • 切片的通用写法是 start : stop : step
week = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']
print(week[1:4:2])  # ['Tuesday', 'Thursday']
print(week[:4:2])  # ['Monday', 'Wednesday']
print(week[1::2])  # ['Tuesday', 'Thursday']
print(week[::-1])  
# ['Friday', 'Thursday', 'Wednesday', 'Tuesday', 'Monday']

常用操作符

  • 等号操作符:==
  • 连接操作符 +
  • 重复操作符 *
  • 成员关系操作符 innot in

举例如下:

list1 = [123, 456]
list2 = [456, 123]
list3 = [123, 456]

print(list1 == list2)  # False
print(list1 == list3)  # True

list4 = list1 + list2  # extend()
print(list4)  # [123, 456, 456, 123]

list5 = list3 * 3
print(list5)  # [123, 456, 123, 456, 123, 456]

list3 *= 3
print(list3)  # [123, 456, 123, 456, 123, 456]

print(123 in list3)  # True
print(456 not in list3)  # False

注意:前面三种方法(appendextendinsert)可对列表增加元素,它们没有返回值,是直接修改了原数据对象。 而将两个list相加,需要创建新的 list 对象,从而需要消耗额外的内存,特别是当 list 较大时,尽量不要使用 “+” 来添加list。

其他方法

  • list.count(obj) 统计某个元素在列表中出现的次数
  • list.index(x[, start[, end]]) 从列表中找出某个值第一个匹配项的索引位置
  • list.reverse() 反向列表中元素
  • list.sort(key=None, reverse=False) 对原列表进行排序。

2. 元组

(1)定义

Python 的元组与列表类似,不同之处在于tuple被创建后就不能对其进行修改,类似字符串。元组也可以利用整数对其进行索引与切片。元组利用小括号把所有元素绑定在一起,用逗号将元素分隔开。

注意,创建元组可以用小括号 (),也可以什么都不用,为了可读性,建议还是用 ()。元组中只包含一个元素时,需要在元素后面添加逗号,否则括号会被当作运算符使用。举例如下:

x = (1)
print(type(x))  # <class 'int'>

x = (1,)
print(type(x))  # <class 'tuple'>

print(8 * (8))  # 64
print(8 * (8,))  # (8, 8, 8, 8, 8, 8, 8, 8)

二维数组举例如下:

x = (1, 10.31, 'python'), ('data', 11)
print(x)
# ((1, 10.31, 'python'), ('data', 11))

print(x[0])
# (1, 10.31, 'python')
print(x[0][0], x[0][1], x[0][2])
# 1 10.31 python

print(x[0][0:2])
# (1, 10.31)

(2)操作

更新元组

举例如下:

week = ('Monday', 'Tuesday', 'Thursday', 'Friday')
week = week[:2] + ('Wednesday',) + week[2:]
print(week)  # ('Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday')

删除元组

举例如下:

t1 = (1, 2, 3, [4, 5, 6])
print(t1)  # (1, 2, 3, [4, 5, 6])

t1[3][0] = 9
print(t1)  # (1, 2, 3, [9, 5, 6])

常用操作符

  • 等号操作符:==
  • 连接操作符 +
  • 重复操作符 *
  • 成员关系操作符 innot in

其他方法

  • tuple.count(obj) 统计某个元素在列表中出现的次数
  • tuple.index(x) 找到元素在元组中的索引

此外,还可以对元组解压提取全部或部分元素,举例如下:

#解压元组(全部元素)

#一维
t = (1, 10.31, 'python')
(a, b, c) = t
print(a, b, c)
# 1 10.31 python

#二维
t = (1, 10.31, ('OK', 'python'))
(a, b, (c, d)) = t
print(a, b, c, d)
# 1 10.31 OK python


#提取某几个元素

#把多个元素丢给rest变量
t = 1, 2, 3, 4, 5
a, b, *rest, c = t
print(a, b, c)  # 1 2 5
print(rest)  # [3, 4]

#如果不在乎 rest 变量,那么就用通配符「*」加上下划线「_」
t = 1, 2, 3, 4, 5
a, b, *_ = t
print(a, b)  # 1 2

3. 字符串

(1)定义

Python 中字符串被定义为引号之间的字符集合,支持使用成对的单引号或双引号。

注意,三引号允许一个字符串跨多行,字符串中可以包含换行符、制表符以及其他特殊字符。

Python常用转义字符

转义字符描述
\\反斜杠符号
\'单引号
\"双引号
\n换行
\t横向制表符(TAB)
\r回车

举例如下:

print('let\'s go')  # let's go
print("let's go")  # let's go
print('C:\\now')  # C:\now
print("C:\\Program Files\\Intel\\Wifi\\Help")
# C:\Program Files\Intel\Wifi\Help

(2)切片与拼接

类似于元组,具有不可修改性。切片与索引形式也与其一致。

(3)内置方法

  • capitalize() 将字符串的第一个字符转换为大写。
  • lower() 转换字符串中所有大写字符为小写。
  • upper() 转换字符串中的小写字母为大写。
  • swapcase() 将字符串中大写转换为小写,小写转换为大写。
  • count(str, beg= 0,end=len(string)) 返回str在 string 里面出现的次数,如果beg或者end指定则返回指定范围内str出现的次数。
  • endswith(suffix, beg=0, end=len(string)) 检查字符串是否以指定子字符串 suffix 结束,如果是,返回 True,否则返回 False。如果 beg 和 end 指定值,则在指定范围内检查。
  • startswith(substr, beg=0,end=len(string)) 检查字符串是否以指定子字符串 substr 开头,如果是,返回 True,否则返回 False。如果 beg和 end 指定值,则在指定范围内检查。
  • find(str, beg=0, end=len(string)) 检测 str 是否包含在字符串中,如果指定范围 beg 和 end,则检查是否包含在指定范围内,如果包含,返回开始的索引值,否则返回 -1。
  • rfind(str, beg=0,end=len(string)) 类似于 find() 函数,不过是从右边开始查找。
  • isnumeric() 如果字符串中只包含数字字符,则返回 True,否则返回 False。
  • ljust(width[, fillchar])返回一个原字符串左对齐,并使用fillchar(默认空格)填充至长度width的新字符串。
  • rjust(width[, fillchar])返回一个原字符串右对齐,并使用fillchar(默认空格)填充至长度width的新字符串。
  • lstrip([chars]) 截掉字符串左边的空格或指定字符。
  • rstrip([chars]) 删除字符串末尾的空格或指定字符。
  • strip([chars]) 在字符串上执行lstrip()rstrip()
  • partition(sub)从左边开始查找找到子字符串sub,把字符串分为一个三元组(pre_sub,sub,fol_sub),如果字符串中不包含sub则返回('原字符串','','')
  • rpartition(sub)类似于partition()方法,不过是从右边开始查找。
  • replace(old, new [, max]) 把 将字符串中的old替换成new,如果max指定,则替换不超过max次。
  • split(str="", num) 不带参数默认是以空格为分隔符切片字符串,如果num参数有设置,则仅分隔num个子字符串,返回切片后的子字符串拼接的列表。
  • splitlines([keepends]) 按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,如果参数keepends为 False,不包含换行符,如果为 True,则保留换行符。
  • maketrans(intab, outtab) 创建字符映射的转换表,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。
  • translate(table, deletechars="") 根据参数table给出的表,转换字符串的字符,要过滤掉的字符放到deletechars参数中。

(4)字符串格式化

字符串格式化可以使用%方法,具体表示符号如下所示:

符 号描述
%c格式化字符及其ASCII码
%s格式化字符串,用str()方法处理对象
%r格式化字符串,用rper()方法处理对象
%d格式化整数
%o格式化无符号八进制数
%x格式化无符号十六进制数
%X格式化无符号十六进制数(大写)
%f格式化浮点数字,可指定小数点后的精度
%e用科学计数法格式化浮点数
%E作用同%e,用科学计数法格式化浮点数
%g根据值的大小决定使用%f或%e
%G作用同%g,根据值的大小决定使用%f或%E

辅助指令如下:

符号功能
m.nm 是显示的最小总宽度,n 是小数点后的位数(如果可用的话)
-用作左对齐
+在正数前面显示加号( + )
#在八进制数前面显示零('0'),在十六进制前面显示'0x'或者'0X'(取决于用的是'x'还是'X')
0显示的数字前面填充'0'而不是默认的空格

举例如下:

print('%5.1f' % 27.658)  # ' 27.7'
print('%.2e' % 27.658)  # 2.77e+01
print('%10d' % 10)  # '        10'
print('%-10d' % 10)  # '10        '
print('%+d' % 10)  # +10
print('%#o' % 10)  # 0o12
print('%#x' % 108)  # 0x6c
print('%010d' % 5)  # 0000000005

此外,字符串格式化操作还可以使用format()方法实现,该方法不需要关注数据类型,单个参数可以多次输出,且不用考虑参数顺序。举例如下:

str8 = "{0} Love {1}".format('I', 'Lsgogroup')  # 位置参数
print(str8)  # I Love Lsgogroup

str8 = "{a} Love {b}".format(a='I', b='Lsgogroup')  # 关键字参数
print(str8)  # I Love Lsgogroup

str8 = "{0} Love {b}".format('I', b='Lsgogroup')  # 位置参数要在关键字参数之前
print(str8)  # I Love Lsgogroup

str8 = '{0:.2f}{1}'.format(27.658, 'GB')  # 保留小数点后两位
print(str8)  # 27.66GB

4. 字典

(1)定义

字典是无序的 键:值(key:value)对(元素)集合,键必须是互不相同的(在同一个字典之内)。key可以为任意不可变类型,通常用字符串或数值表示。关键点为【{}  :  ,】三个元素。

注意,字典类型dict内部存放的顺序和key放入的顺序是没有关系的,dict插入和查找的速度极快,不会随着key的增加而增加,但是需要占用大量的内存。

(2)创建和访问字典

方法一:可以通过字符串或数值作为key来创建字典。如果我们取的键在字典中不存在,会直接报错KeyError。举例如下:

dic1 = {1: 'one', 2: 'two', 3: 'three'}
print(dic1[1])  # one
print(dic1[4])  # KeyError: 4

dic2 = {'rice': 35, 'wheat': 101, 'corn': 67}
print(dic2)  # {'wheat': 101, 'corn': 67, 'rice': 35}
print(dic2['rice'])  # 35

方法二:利用dict()函数创建一个空的字典。注意,一个key只能对应一个value,多次对一个key放入value,后面的值会取代前面的值。

dic = dict()
dic['a'] = 1
dic['b'] = 2
dic['c'] = 3

print(dic)
# {'a': 1, 'b': 2, 'c': 3}

dic['a'] = 11
print(dic)
# {'a': 11, 'b': 2, 'c': 3}

dic['d'] = 4
print(dic)
# {'a': 11, 'b': 2, 'c': 3, 'd': 4}

此外,还有dict(mapping)和dict(one=1,two=2)两种,对于后者,键只能为字符串类型。举例如下:

#mapping
dic1 = dict([('apple', 4139), ('peach', 4127), ('cherry', 4098)])
print(dic1)  # {'cherry': 4098, 'apple': 4139, 'peach': 4127}

dic2 = dict((('apple', 4139), ('peach', 4127), ('cherry', 4098)))
print(dic2)  # {'peach': 4127, 'cherry': 4098, 'apple': 4139}

#dict(one=1, two=2)
dic = dict(name='Tom', age=10)
print(dic)  # {'name': 'Tom', 'age': 10}
print(type(dic))  # <class 'dict'>

(3)内置方法

  • dict.fromkeys(seq[, value]) 用于创建一个新字典,以序列 seq 中元素做字典的键,value 为字典所有键对应的初始值。
  • dict.keys()返回一个可迭代对象,可以使用 list() 来转换为列表,列表为字典中的所有键。
  • dict.values()返回一个迭代器,可以使用 list() 来转换为列表,列表为字典中的所有值。
  • dict.items()以列表返回可遍历的 (键, 值) 元组数组。可以使用 list() 或tuple()来转换为列表或数组
  • dict.get(key, default=None) 返回指定键的值,如果值不在字典中返回默认值。
  • dict.setdefault(key, default=None)get()方法 类似, 如果键不存在于字典中,将会添加键并将值设为默认值。
  • key in dict in 操作符用于判断键是否存在于字典中,如果键在字典 dict 里返回true,否则返回false。而not in操作符刚好相反,如果键在字典 dict 里返回false,否则返回true
  • dict.pop(key[,default])删除字典给定键 key 所对应的值,返回值为被删除的值。key 值必须给出。若key不存在,则返回 default 值。
  • del dict[key] 删除字典给定键 key 所对应的值。
  • dict.popitem()随机返回并删除字典中的一对键和值,如果字典已经为空,却调用了此方法,就报出KeyError异常。
  • dict.clear()用于删除字典内所有元素。
  • dict.copy()返回一个字典的浅复制。浅复制内存地址不一致(与直接赋值相区分),浅复制只拷贝父对象(一级目录),二级目录不拷贝。
  • dict.update(dict2)把字典参数 dict2 的 key:value对 更新到字典 dict 里。

5. 集合

(1)定义

Python 中setdict类似,也是一组key的集合,但不存储value。由于key不能重复,所以,在set中,没有重复的key

注意,key为不可变类型。至于可变类型与不可变类型究竟是啥,这个之后再讲。

举例如下:

num = {}
print(type(num))  # <class 'dict'>
num = {1, 2, 3, 4}
print(type(num))  # <class 'set'>

(2)创建集合

创建集合需先创建对象再加入元素。创建空集合的时候需使用set()函数,否则创建的为空字典。重复元素会在set()中自动过滤掉。举例如下:

basket = set()
basket.add('apple')
basket.add('banana')
print(basket)  # {'banana', 'apple'}

此外,set()还可以把列表或元组转为集合。举例如下:

a = set('abracadabra')
print(a)  
# {'r', 'b', 'd', 'c', 'a'}

b = set(("Google", "Lsgogroup", "Taobao", "Taobao"))
print(b)  
# {'Taobao', 'Lsgogroup', 'Google'}

c = set(["Google", "Lsgogroup", "Taobao", "Google"])
print(c)  
# {'Taobao', 'Lsgogroup', 'Google'}

需注意,集合具有两个特点:无序 (unordered) 和唯一 (unique)。所以我们不可以为集合创建索引或执行切片(slice)操作,也没有键(keys)可用来获取集合中元素的值,但是可以判断一个元素是否在集合中。

(3)访问集合中的值

  • 可以使用len()內建函数得到集合的大小。
  • 可以使用for把集合中的数据一个个读取出来。
  • 可以通过innot in判断一个元素是否在集合中已经存在

(4)内置方法

  • set.add(elmnt)用于给集合添加元素,如果添加的元素在集合中已存在,则不执行任何操作。
  • set.update(set)用于修改当前集合,可以添加新的元素或集合到当前集合中,如果添加的元素在集合中已存在,则该元素只会出现一次,重复的会忽略。
  • set.remove(item) 用于移除集合中的指定元素。如果元素不存在,则会发生错误。
  • set.discard(value) 用于移除指定的集合元素。remove() 方法在移除一个不存在的元素时会发生错误,而 discard() 方法不会。
  • set.pop() 用于随机移除一个元素,并赋值。
  • set.intersection(set1, set2) 返回两个集合的交集。
  • set1 & set2 返回两个集合的交集。
  • set.intersection_update(set1, set2) 交集,在原始的集合上移除不重叠的元素。
  • set.union(set1, set2) 返回两个集合的并集。
  • set1 | set2 返回两个集合的并集。
  • set.difference(set) 返回集合的差集。
  • set1 - set2 返回集合的差集。
  • set.difference_update(set) 集合的差集,直接在原来的集合中移除元素,没有返回值。
  • set.symmetric_difference(set)返回集合的异或。
  • set1 ^ set2 返回集合的异或。
  • set.symmetric_difference_update(set)移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。
  • set1.issubset(set2)判断集合1是不是被其他集合2包含,如果是则返回 True,否则返回 False。
  • set1 <= set2 判断集合是不是被其他集合包含,如果是则返回 True,否则返回 False
  • set1.issuperset(set2)用于判断集合1是不是包含其他集合2,如果是则返回 True,否则返回 False。
  • set1 >= set2 判断集合是不是包含其他集合,如果是则返回 True,否则返回 False。
  • set.isdisjoint(set) 用于判断两个集合是不是不相交(相交表示无重复值),如果是返回 True,否则返回 False。

(5)集合的转换

可以利用tuple()或list()函数对集合直接进行转换。

(6)不可变集合

Python 提供了不能改变元素的集合的实现版本,即不能增加或删除元素,类型名叫frozenset。需要注意的是frozenset仍然可以进行集合操作,只是不能用带有update的方法。frozenset([iterable]) 返回一个冻结的集合,冻结后集合不能再添加或删除任何元素。

6. 序列

(1)定义

在 Python 中,序列类型包括字符串、列表、元组、集合和字典,这些序列支持一些通用的操作,但比较特殊的是,集合和字典不支持索引、切片、相加和相乘操作。

(2)针对序列的内置函数

  • list(sub) 把一个可迭代对象转换为列表。
  • tuple(sub) 把一个可迭代对象转换为元组。
  • str(obj) 把obj对象转换为字符串。
  • len(s) 返回对象(字符、列表、元组等)长度或元素个数。
  • max(sub)返回序列或者参数集合中的最大值。
  • min(sub)返回序列或参数集合中的最小值。
  • sum(iterable[, start=0]) 返回序列iterable与可选参数start的总和。
  • sorted(iterable, key=None, reverse=False) 对所有可迭代的对象进行排序操作。
  • reversed(seq) 函数返回一个反转的迭代器。
  • enumerate(sequence, [start=0])。用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。
  • zip(iter1 [,iter2 [...]])用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的对象,这样做的好处是节约了不少的内存。如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同。

7. 总结

(1)可变类型与不可变类型

首先讲一下可变类型与不可变类型,这个在我们学习数据类型的时候还是很重要的。

  • 麻烦方法:用 id(X) 函数,对 X 进行某种操作,比较操作前后的 id,如果不一样,则 X 不可变,如果一样,则 X 可变。
  • 便捷方法:用 hash(X),只要不报错,证明 X 可被哈希,即不可变,反过来不可被哈希,即可变。

我们刚刚学的几种数据类型中,数值、字符和元组都可以被哈希,因此,他们是不可变类型;而列表、集合、字典不能被哈希,因此他们是可变类型。

(2)映射类型与序列类型

字典是Python唯一一个映射类型;

字符串、元组、列表属于序列类型。

举报

相关推荐

0 条评论