Python编程itertools模块处理可迭代集合相关函数
作者:梦想橡皮擦 发布时间:2023-05-31 02:18:07
容器与可迭代对象
在正式开始前先补充一些基本概念在 Python 中存在容器 与 可迭代对象
容器:用来存储多个元素的数据结构,例如 列表,元组,字典,集合等内容;
可迭代对象:实现了
__iter__
方法的对象就叫做可迭代对象。
从可迭代对象中还衍生出 迭代器 与 生成器:
迭代器:既实现了
__iter__
,也实现了__next__
方法的对象叫做迭代器;生成器:具有
yield
关键字的函数都是生成器。
这样就比较清楚了,可迭代对象的范围要大于容器。而且可迭代对象只能使用一次,使用完毕再获取值就会提示 StopIteration
异常。
除此之外,可迭代对象还有一些限制:
不能对可迭代对象使用
len
函数;可以使用
next
方法处理可迭代对象,容器也可以通过iter
函数转换成迭代器;for 语句会自动调用容器的
iter
函数,所以容器也能被循环迭代。
count() 函数
count
函数一般与 range
函数对比学习,例如 range
函数需要定义生成范围的下限,上限与步长可选,而 count
函数不同,指定下限与步长,上限值不用声明。
函数原型声明如下
count(start=0, step=1) --> count object
测试代码如下,其中必须添加跳出循环的判定条件,否则代码会一直运行下去。
from itertools import count
a = count(5, 10)
for i in a:
print(i)
if i > 100:
break
除此之外,count
函数还接收非整数参数,所以下述代码中定义的也是正确的。
from itertools import count
a = count(0.5, 0.1)
for i in a:
print(i)
if i > 100:
break
cycle 函数
用 cycle
函数可以循环一组值,测试代码如下所示:
from itertools import cycle
x = cycle('梦想橡皮擦abcdf')
for i in range(5):
print(next(x), end=" ")
print("\n")
print("*" * 100)
for i in range(5):
print(next(x), end=" ")
代码输出如下内容:
梦 想 橡 皮 擦
****************************************************************************************************
a b c d f
可以看到 cycle
函数与 for
循环非常类似。
repeat 函数
repeat
函数用于重复返回某个值,官方给出的函数描述如下所示:
class repeat(object):
"""
repeat(object [,times]) -> create an iterator which returns the object
for the specified number of times. If not specified, returns the object
endlessly.
进行一下简单的测试,看一下效果:
from itertools import repeat
x = repeat('橡皮擦')
for i in range(5):
print(next(x), end=" ")
print("\n")
print("*" * 100)
for i in range(5):
print(next(x), end=" ")
怎么看这个函数,都好像没有太大用处。
enumerate 函数,添加序号
这个函数在前面的文章中,已经进行过简单介绍,并且该函数在 __builtins__
包中,所以不再过多说明
基本格式如下所示:
enumerate(sequence, [start=0])
其中 start
参数是下标起始位置。
accumulate 函数
该函数基于给定的函数返回一个可迭代对象,默认是累加效果,即第二个参数为 operator.add
,测试代码如下:
from itertools import accumulate
data = [1, 2, 3, 4, 5]
# 计算累积和
print(list(accumulate(data))) # [1, 3, 6, 10, 15]
针对上述代码,修改为累积。
from itertools import accumulate
import operator
data = [1, 2, 3, 4, 5]
# 计算累积
print(list(accumulate(data, operator.mul)))
除此之外,第二个参数还可以为 max
,min
等函数,例如下述代码:
from itertools import accumulate
data = [1, 4, 3, 2, 5]
print(list(accumulate(data, max)))
代码输出如下内容,其实是将 data
里面的任意两个值进行了比较,然后留下最大的值。
[1, 4, 4, 4, 5]
chain 与 groupby 函数
chain
函数用于将多个迭代器组合为单个迭代器,而 groupby
可以将一个迭代器且分为多个子迭代器。
首先展示一下 groupby
函数的应用:
from itertools import groupby
a = list(groupby('橡橡皮皮擦擦'))
print(a)
输出内容如下所示:
[('橡', <itertools._grouper object at 0x0000000001DD9438>),
('皮', <itertools._grouper object at 0x0000000001DD9278>),
('擦', <itertools._grouper object at 0x00000000021FF710>)]
为了使用 groupby
函数,建议先对原列表进行排序,因为它是有点像切片一样,发现不同的就分出一个迭代器。
chain
函数的用法如下,将多个迭代对象进行拼接:
from itertools import groupby, chain
a = list(chain('ABC', 'AAA', range(1,3)))
print(a)
zip_longest 与 zip
zip
函数在之前的博客中已经进行过说明,zip_longest
与 zip
的区别就是,zip
返回的结果以最短的序列为准,而 zip_longest
以最长的为准。
测试代码如下,自行比对结果即可。
from itertools import zip_longest
a = list(zip('ABC', range(5), [10, 20, 30, 40]))
print(a)
a = list(zip_longest('ABC', range(5), [10, 20, 30, 40]))
print(a)
zip_logest
如果碰到长度不一致的序列,缺少部分会填充 None
。
tee 函数
tee
函数可以克隆可迭代对象,产出多个生成器,每个生成器都可以产出输入的各个元素。
from itertools import tee
a = list(tee('橡皮擦'))
print(a)
compress 函数
该函数通过谓词(是否,True/False)来确定对某个元素的取舍问题,最简单的代码如下所示:
from itertools import compress
a = list(compress('橡皮擦', (0, 1, 1)))
print(a)
islice、dropwhile、takewhile、filterfalse、filter
这几个函数都是从输入的可迭代对象中获取一个子集,而且不修改元素本身。
本部分只罗列各个函数的原型声明,具体用法直接参考使用即可。
islice(iterable, stop) --> islice object
islice(iterable, start, stop[, step]) --> islice object
dropwhile(predicate, iterable) --> dropwhile object
takewhile(predicate, iterable) --> takewhile object
filterfalse(function or None, sequence) --> filterfalse object
其中只有 filterfalse
中的参数是函数在前,序列在后。
测试代码如下,尤其注意第一个参数是 callable
即函数。
from itertools import islice, dropwhile, takewhile, filterfalse
a = list(filterfalse(lambda x: x in ["皮", "擦"], '橡皮擦'))
print(a)
写在后面
以上内容就是本文的全部内容,在使用无限迭代器函数 count
,cycle
,repeat
的时候,一定要注意即使停止。
来源:https://blog.csdn.net/hihell/article/details/120181580
猜你喜欢
- 本文实例讲述了python简单实现基于SSL的 IRC bot。分享给大家供大家参考。具体如下:#!/usr/bin/python# -*-
- 正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自
- original article by sp(’Sergio Pereira’) Sergio Pereiralast update: Ma
- ASP是目前一种广为应用的用来快速构建动态WEB站点的编程语言,默认的内置开发语言是VBScript,由于ASP和微软Windows系列操作
- 学习目的: 学习ADO.NET用法,并如何用DataRearder读取数据 今天练习数据库的最基本用法,如何打开数据库。首先在网站设置文件w
- 以下的文章主要介绍的是SQL Serve数据库到DB2连接服务器的实现过程,我们大家都知道不同数据库平台的互连,一般对其称之为数据库的异构服
- 前些日子有网友问:将ASP纪录集输出成n列的的表格形式显示的方法?现在写了一个,方便大家使用。'定义变量 Dim cn,r
- 正在看的ORACLE教程是:ORACLE8的分区管理。摘要:本篇文章介绍了ORACLE数据库的新特性—分区管理,并用例子说明使用方法。 关键
- 我们来看看MD5加密码的实现:注意看一下他数据库里的加密位数!先在通用处申明:Private Const BITS_TO
- Qt Designer的介绍在PyQt中编写UI界面可以直接通过代码来实现,也可以通过Qt Designer来完成。Qt Designer的
- 关于asp缓存函数,类什么的,在网上可以说笔笔皆是,为啥我要不辞辛苦去写一个呢?大概看了下,各有各的优点吧,可是大部分好像不可以缓存数据额,
- 注:文中未表明的地方output 输出都是基于IE6.0,其中表明FF的地方为Mozilla Firefox2.0,还要注意文中的大小写ja
- 分页设计我们经常会见到,这里有30个分页设计,以供大家欣赏欣赏借鉴。
- 思路改进原博主文章(Python GUI–Tkinter简单实现个性签名设计)的代码,原先的代码是基于Python2的,我这份代码基于Pyt
- 因为m1芯片是arm版本的架构,以前在mac上的很多软件都是基于Intel架构的软件,apple开发了rossta2,可以在m1上运行int
- 本文实例讲述了python追加元素到列表的方法。分享给大家供大家参考。具体实现方法如下:scores = ["1",&q
- 初学ASP,程序是能勉强写出来了,但若每进行一次网站页面的改版,所有的源程序都将进行一次移植手术。为此所耗费的人力精力不计其数,甚至一不小心
- 题目描述原题链接 :35. 搜索插入位置 - 力扣(LeetCode) (leetcode-cn.com)给定一个排序数组和一个目标值,在数
- 分析古诗文网站下图1展示了古诗文网站—》诗文 栏目的首页数据。该栏目的地址是:https://so.gushiwen.cn/shiwens/
- 之前在网上看过一些介绍Django处理请求的流程和Django源码结构的文章,觉得了解一下这些内容对开发Django项目还是很有帮助的。所以