Python内置数据类型中的集合详解
作者:江南野栀子 发布时间:2022-07-13 04:06:38
1. 集合 set 简介
集合的最大特征是其每个元素都是唯一的,它可以删除、可以增加、也可以通过增删实现替换元素,但是它是没有下标的,你无法通过下标或者切片功能访问集合。因为集合就像一个袋子里面装着颜色不一样的玻璃球,你可以替换玻璃球,但是无法指定玻璃球存放的地点。
它最大的作用,就是它元素的唯一,它经常被用来清除多余的数据。
1.1 使用 { } 直接创建集合
可以使用 {} 直接创建集合,但是不能使用 {} 创建空集合,因为 {} 被用来创建空字典。你只能通过 set() 来创建空集合。
1.2 使用 set() 函数创建集合
使用内置函数 set,可以快速的将其他类型的可迭代对象转换成 集合 对象。这些可迭代对象,可以是字符串、列表、元组等等。
print("创建一个空集合")
print(set())
str1 = 'ABCDEF!'
s=set(str1)
print("*"*40)
print("一个由字符串转换的集合,每个元素即唯一的单独字符")
print(s)
list1 = [0,1,2,3,4,3,2,1]
s=set(list1)
print("*"*40)
print("一个由列表转换的集合,但是在列表中重复的元素只会出现一次")
print(s)
2. 集合没有切片功能!
请仔细理解,集合没有切片功能,这意味着什么,这意味着无法对它排序(当然可以转换成列表再排序),意味着无法用 while 循环配合下标依次获得元素,你可以用 for 循环获取。
3. 处理集合的常见内置函数
3.1 len 函数
len 函数返回集合的长度,即元素的个数。
3.2 map 函数
map 函数对集合中的每个元素进行相同的操作,然后返回一个 map 对象,再使用 set 函数可以得到集合。
>>> a
{'sdf', 'er'}
>>> set(map(lambda x:x+"-",a))
{'er-', 'sdf-'}
3.3 filter 函数
filter 函数对集合中的每个元素进行相同的操作,符合条件的元素才留下来,返回一个 filter 类型的对象。
>>> a
{'sdf', 'er'}
>>> set(filter(lambda x:len(x)==2,a))
{'er'}
3.4 reduce 函数
filter 函数依次对集合中的元素进行相同的迭代操作最后得到一个对象。
>>> import functools
>>> a
{'sdf', 'er'}
>>> functools.reduce(lambda x,y:x+"~"+y,a)
'sdf~er'
3.5 sum 函数
sum 函数,只对元素是数值的集合有效,返回列表中的元素总和,如果元素类型不是数值,则返回 TypeError。
3.6 max 函数
max 函数,返回集合中的元素最大值。
3.7 min 函数
min 函数,返回集合中的元素最小值。
>>> a={1,2,3}
>>> sum(a)
6
>>> min(a)
1
>>> max(a)
3
>>>
3.8 sorted 函数
sorted 函数会对集合按照指定方式进行排序,请注意,使用 sorted 函数会得到一个排好序的列表,不是集合!!!原集合不会改变。
list1 = [0,1,2,3,4,3,2,1]
s=set(list1)
s1=sorted(s)
print(s1)
print(type(s1))
3.9 enumerate 函数
enumerate 函数可以将一个集合依次取出。
3.10 any 函数
any() 函数用于判断给定的集合的所有元素是否都为 False,则返回 False,如果有一个为 True,则返回 True。
3.11 all 函数
all() 函数用于判断给定的集合的所有元素是否都为 TRUE,如果是返回 True,否则返回 False。
4. 集合的内置方法
4.1 .add(val)
.add(val) 方法附加一个元素 val,如果 val 已经在集合中,那么原来的集合不变化。
4.2 .clear()
.clear() 方法将集合清空。
4.3 .copy()
.copy() 方法将返回集合的拷贝(而不是和原来的列表共用同一个地址)。
4.4 .difference(set1,set2,...)
difference() 方法用于返回集合的差集,即返回的集合元素包含在第一个集合中,但不包含在第二、三、N个集合(方法的参数)中。
4.5 .difference_update(set1,set2,...)
difference_update() 方法用于移除两个或者多个集合中都存在的元素。
difference_update() 方法与 difference() 方法的区别在于 difference() 方法返回一个移除相同元素的新集合,而 difference_update() 方法是直接在原来的集合中移除元素,没有返回值。
# 集合的使用
a={1,2,3,4,1}
b={4,5,6,7}
# 1.集合是不会有重复的元素的
print("1. ",a)
# 2.集合使用 add 方法加一个元素
a.add("6")
print("2. ",a)
# 3.集合使用 clear 方法清空
a.clear()
print("3. ",a)
a={1,2,3,4}
# 4.集合使用 copy 方法复制数据
c=a.copy()
print("4. ",c)
# 5.集合使用 difference 方法返回
# 和其他集合不一样的数据
print("5. ",a.difference(b))
# 6.集合使用 difference_update 方法删除
# 和其他集合一样的数据
# a={1,2,3,4}
# b={4,5,6,7}
a={1,2,3,4}
b={4,5,6,7}
print("6. ",a.difference_update(b))
print("6. ",a)
a={1,2,3,4}
c={1}
a.difference_update(b,c)
print("6. ",a)
# 7.集合使用 discard 方法删掉数据 val
a={1,2,3,4}
a.discard(2)
print("7. ",a)
4.6 .discard(val)
.discard 方法删除集合中指定的元素。
4.7 .intersection(set1,set2,...)
.intersection 方法返回集合的交集,自身不受影响。
4.8 .intersection_update()
.intersection 方法原地改变自身为两个或者多个集合的交集。
>>> a={1,2,3,4,5}
>>> b={2,3,4,5,6,7}
>>> a.intersection(b)
{2, 3, 4, 5}
>>> a
{1, 2, 3, 4, 5}
>>> b
{2, 3, 4, 5, 6, 7}
>>> a.intersection_update(b)
>>> a
{2, 3, 4, 5}
>>> b
{2, 3, 4, 5, 6, 7}
4.9 .isdisjoint()
.isdisjoint 方法判断两个集合是否包含相同的元素,如果没有返回 True,否则返回 False。
>>> a={1,2,3,4,5}
>>> b={2,3,4,5,6,7}
>>> c={"a","b"}
>>> a.isdisjoint(b)
False
>>> a.isdisjoint(c)
True
4.10 .issubset(other_set)
.issubset 方法判断自身集合是否为该方法参数集合 other_set 的子集。
>>> a={1,2,3,4,5}
>>> b={2,3,4,5,6,7}
>>> c={1}
>>> a.issubset(b)
False
>>> a.issubset(c)
False
>>> c.issubset(a)
True
4.11 .issuperset(other_set)
.issuperset 方法判断该方法参数集合 other_set 是否为自身集合的子集。
>>> a={1,2,3,4,5}
>>> b={2,3,4,5,6,7}
>>> c={1}
>>> a.issuperset(b)
False
>>> a.issuperset(c)
True
4.12 .pop()
.pop() 方法将返回集合中的一个元素,原集合将删除该元素。
请注意,集合中的 pop 方法是没有 index 参数!如果像使用列表中的 pop 方法输入 index 参数,则返回 TypeError: pop() takes no arguments (1 given) 错误。
4.13 .remove()
.remove(val) 方法将删除集合中的 val 元素,返回为空。如果 val 不在集合中,则返回 KeyError 错误。
4.14 .symmetric_difference()
返回两个集合中不重复的元素集合,而不改变自身集合。
4.15 .symmetric_difference_update()
移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。
# 10.集合使用 ^ 操作符返回
# 两个集合中不一样的数据
# 等同于 symmetric_difference方法
a={1,2,3,4}
b={4,5,6,7}
tmp=a^b
print("10. ",tmp)
print("a==>",a)
print("b==>",b)
print("使用 ^ 操作符 原来的集合不受影响")
print("*"*60)
print("a.symmetric_difference(b)==>",a.symmetric_difference(b))
print("a==>",a)
print("b==>",b)
print("使用 symmetric_difference方法 原来的集合不受影响")
print("*"*60)
print("a.symmetric_difference_update(b)==>",a.symmetric_difference_update(b))
print("使用 symmetric_difference_update 原来的集合会改变")
print("a==>",a)
print("b==>",b)
print("*"*60)
4.16 .union(other_set)
.union 方法返回两个集合的并集,而不改变自身集合。
4.17 .update(other_set)
.update 方法给自身集合集合添加元素。
>>> a={0,1}
>>> b={3,4}
>>> c={5,6}
>>> a.union(b)
{0, 1, 3, 4}
>>> a
{0, 1}
>>> b
{3, 4}
>>> a.update(b)
>>> a
{0, 1, 3, 4}
>>> b
{3, 4}
5. 集合和运算符
5.1 - 运算符
a 、b 是两个集合;a - b类似于 a.difference(b) 方法,即返回集合a中包含而集合b中不包含的元素,自身不受改变。
>>> a={0,1,2,3}
>>> b={2,3,4,5}
>>> a-b
{0, 1}
>>> a.difference(b)
{0, 1}
5.2 | 运算符
a 、b 是两个集合;a | b类似于 a.union(b) 方法,即返回集合a和b中所有的元素,自身不受改变。
>>> a={0,1,2,3}
>>> b={2,3,4,5}
>>> a|b
{0, 1, 2, 3, 4, 5}
>>> a.union(b)
{0, 1, 2, 3, 4, 5}
5.3 & 运算符
a 、b 是两个集合;a & b类似于 a.intersection(b) 方法,即返回集合a和b中都包含了的元素,自身不受改变。
# 9.集合使用 & 选出集合重叠的部分
# 等同于 insection 方法
a={1,2,3,4}
b={4,5,6,7}
print("********* 初始数据 ***********")
print("a==>",a)
print("b==>",b)
print("8. a & b==>",a & b)
print("执行 a & b 后")
print("a==>",a)
print("b==>",b)
print("使用 & 操作符 原来的集合不受影响")
print("*"*60)
print("8. a.intersection(b)==>",a.intersection(b))
print("使用 intersection 方法 原来的集合不受影响")
print("a==>",a)
print("b==>",b)
print("*"*60)
print("8. a.intersection_update(b)==>",a.intersection_update(b))
print("使用 intersection_update 方法 原来的集合会改变")
print("a==>",a)
print("b==>",b)
print("*"*60)
5.4 ^ 运算符
a 、b 是两个集合;a ^ b类似于 a.symmetric_difference(b) 方法,即返回不同时包含于a和b的元素,自身不受改变。
>>> a={0,1,2,3}
>>> b={2,3,4,5}
>>> a.symmetric_difference(b)
{0, 1, 4, 5}
>>> a^b
{0, 1, 4, 5}
5.5 in 、not in 运算符
in 运算符判断某个元素属于某个集合
not in 运算符判断某个元素不属于某个集合
>>> a={0,1,2,3}
>>> 0 in a
True
>>> "0" in a
False
来源:https://blog.csdn.net/u010701274/article/details/123548964


猜你喜欢
- MySQLTuner 下载地址:http://github.com/rackerhacker/MySQLTuner-perlMySQLTun
- 公司做了个客户,需要图片生成像alibaba的效果。原来开发的系统都是用Aspjpeg进行缩小图的,现在需要处理图片,当然又想到这个组件。但
- 虽然并非你编写的每个 Python 程序都要求一个严格的性能分析,但是让人放心的是,当问题发生的时候,Python 生态圈有各种各样的工具可
- poplib模块接收邮件python的poplib模块是用来从pop3收取邮件的,也可以说它是处理邮件的第一步。POP3协议并不复杂,它也是
- 本文实例讲述了Python multiprocess pool模块报错pickling error问题解决方法。分享给大家供大家参考,具体如
- 当“ 页面重构工程师 ”这个职位的面试官也蛮长一段时间了,跟前两年比起来,总的来说来应聘的同学能力在很大程度上有了提高,记得两年前的一场招聘
- 切片的长度,显而易见的就是元素的个数,根据元素的个数进行返回具体的长度。切片的长度,更像是一个警戒值,如果长度与容量相等,就会进行容量的扩容
- 本文介绍了详解Python实现多进程异步事件驱动引擎,分享给大家,具体如下:多进程异步事件驱动逻辑逻辑code# -*- coding: u
- 由于本人经常装系统,每次装完系统之后都要重新安装一些软件,安装软件的时候又要上网查找安装的教程,比较麻烦,所以自己整理了MySQL5.7.2
- 这些包可以独立使用,也可以与其他包一起使用以满足复杂的业务需求。Integration Services 可以提取和转换来自多种源(如 XM
- 1. 安装依赖将PyTorch模型转换为ONNX格式可以使它在其他框架中使用,如TensorFlow、Caffe2和MXNet首先安装以下必
- vue-router路由懒加载 和权限控制,今天刚好搞了一个基于node token验证的小demo所以下面介绍下,路由懒加载1、为什么要使
- 目录1. format格式化_填充符号使用1.1 format格式化1.2 format的填充符号的使用2. 字符串相关的方法3. 列表的相
- 用户与Authentication通过session,我们可以在多次浏览器请求中保持数据, 接下来的部分就是用session来处理用户登录了
- Python 在命令行解析方面给出了类似的几个选择:自己解析, 自给自足(batteries-included)的方式,以及大量的
- 前言Go语言是Google内部主推的语言,它作为一门全新的静态类型开发语言,与当前的开发语言相比具有许多令人兴奋不已的新特性。专门针对多处理
- 我们在网页中使用CSS来设置网页、表格和字体大小,一般使用的是网络上较流行的9磅字:<STYLE type=TEXT/CSS
- CREATE OR REPLACE PROCEDURE PROC6338196642095312503719(输入新闻主题 Varchar2
- 前言之前在使用包括大型文档(商汤科技、百度飞浆)代码的时候都一直使用 pip install -v -e . ,这一命令,但是一直不是很清楚
- 本文实例讲述了Python实现统计文本文件字数的方法。分享给大家供大家参考,具体如下:统计文本文件的字数,从当前目录下的file.txt取文