Python中itertools的用法详解
作者:SuPhoebe 发布时间:2022-06-05 13:34:52
iterator
循环器(iterator)是对象的容器,包含有多个对象。通过调用循环器的next()方法 (next()方法,在Python 3.x中),循环器将依次返回一个对象。直到所有的对象遍历穷尽,循环器将举出StopIteration错误。
在for i in iterator结构中,循环器每次返回的对象将赋予给i,直到循环结束。使用iter()内置函数,我们可以将诸如表、字典等容器变为循环器。比如
for i in iter([2, 4, 5, 6]):
print i
标准库中的itertools包提供了更加灵活的生成循环器的工具。这些工具的输入大都是已有的循环器。另一方面,这些工具完全可以自行使用Python实现,该包只是提供了一种比较标准、高效的实现方式。
# import the tools
from itertools import *
无穷循环器
# 从5开始的整数循环器,每次增加2,即5, 7, 9, 11, 13, 15 ...
count(5, 2)
# 重复序列的元素,既a, b, c, a, b, c ...
cycle('abc')
# 重复1.2,构成无穷循环器,即1.2, 1.2, 1.2, ...
repeat(1.2)
# repeat也可以有一个次数限制:
repeat(10, 5) #重复5次10
函数式工具
函数式编程是将函数本身作为处理对象的编程范式。在Python中,函数也是对象,因此可以轻松的进行一些函数式的处理,比如map(), filter(), reduce()函数。
itertools包含类似的工具。这些函数接收函数作为参数,并将结果返回为一个循环器。
from itertools import *
rlt = imap(pow, [1, 2, 3], [1, 2, 3])
for num in rlt:
print(num)
上面显示了imap函数。该函数与map()函数功能相似,只不过返回的不是序列,而是一个循环器。包含元素1, 4, 27,即1**1, 2**2, 3**3的结果。函数pow(内置的乘方函数)作为第一个参数。pow()依次作用于后面两个列表的每个元素,并收集函数结果,组成返回的循环器。
此外,还可以用下面的函数:
starmap(pow, [(1, 1), (2, 2), (3, 3)])
pow将依次作用于表的每个tuple。
ifilter函数与filter()函数类似,只是返回的是一个循环器。
ifilter(lambda x: x > 5, [2, 3, 5, 6, 7]
将lambda函数依次作用于每个元素,如果函数返回True,则收集原来的元素:6, 7。
此外,
ifilterfalse(lambda x: x > 5, [2, 3, 5, 6, 7])
与上面类似,但收集返回False的元素:2, 3, 5。
takewhile(lambda x: x < 5, [1, 3, 6, 7, 1])
当函数返回True时,收集元素到循环器。一旦函数返回False,则停止:1, 3。
dropwhile(lambda x: x < 5, [1, 3, 6, 7, 1])
当函数返回False时,跳过元素。一旦函数返回True,则开始收集剩下的所有元素到循环器:6, 7, 1。
组合工具
我们可以通过组合原有循环器,来获得新的循环器。
循环器和笛卡尔乘积
# 连接两个循环器成为一个。1, 2, 3, 4, 5, 7
chain([1, 2, 3], [4, 5, 7])
# 多个循环器集合的笛卡尔积,相当于嵌套循环。
product('abc', [1, 2])
样例如下
for m, n in product('abc', [1, 2]):
print m, n
'''
a 1
a 2
b 1
b 2
c 1
c 2
'''
排列与组合
# 从'abcd'中挑选两个元素,比如ab, bc, ... 将所有结果排序,返回为新的循环器。
permutations('abc', 2)
注意,上面的组合分顺序,即ab, ba都返回。
# 从'abcd'中挑选两个元素,比如ab, bc, ... 将所有结果排序,返回为新的循环器。
combinations('abc', 2)
注意,上面的组合不分顺序,即ab, ba的话,只返回一个ab。
# 与上面类似,但允许两次选出的元素重复。即多了aa, bb, cc
combinations_with_replacement('abc', 2)
groupby()
将key函数作用于原循环器的各个元素。根据key函数结果,将拥有相同函数结果的元素分到一个新的循环器。每个新的循环器以函数返回结果为标签。
这就好像一群人的身高作为循环器。我们可以使用这样一个key函数: 如果身高大于180,返回”tall”;如果身高底于160,返回”short”;中间的返回”middle”。最终,所有身高将分为三个循环器,即”tall”, “short”, “middle”。
def height_class(h):
if h > 180:
return "tall"
elif h < 160:
return "short"
else:
return "middle"
friends = [191, 158, 159, 165, 170, 177, 181, 182, 190]
friends = sorted(friends, key = height_class)
for m, n in groupby(friends, key = height_class):
print(m)
print(list(n))
注意,groupby的功能类似于UNIX中的uniq命令。分组之前需要使用sorted()对原循环器的元素,根据key函数进行排序,让同组元素先在位置上靠拢。
其它工具
# 根据[1, 1, 1, 0]的真假值情况,选择第一个参数'ABCD'中的元素。A, B, C
compress('ABCD', [1, 1, 1, 0])
# 类似于slice()函数,只是返回的是一个循环器
islice()
# 类似于zip()函数,只是返回的是一个循环器
izip()
总结
以上所述是小编给大家介绍的Python中itertools的用法详解,希望对大家有所帮助!
来源:https://blog.csdn.net/u013007900/article/details/55505306
猜你喜欢
- 问题你想对在Unix系统上面运行的程序设置内存或CPU的使用限制。解决方案resource 模块能同时执行这两个任务。例如,要限制CPU时间
- 这段时间服务器崩溃2次,一直没有找到原因,今天看到论坛发出的错误信息邮件,想起可能是MySQL的默认连接数引起的问题,一查果然,老天,默认
- 本文实例为大家分享了Python3定时发送邮件功能的具体代码,供大家参考,具体内容如下1、 导入模块import osimport date
- 这个可应用于所有浏览器中.<SCRIPT language=javascript>var leave=true; functio
- 以前在介绍SQL2k的时候已经提到了SQL2k对XML的支持,使用for XML语句就可以很容易的把执行的结果转化为一个XML,这样可以在很
- __init__()方法意义重大的原因有两个。第一个原因是在对象生命周期中初始化是最重要的一步;每个对象必须正确初始化后才能正常工作。第二个
- 在官网下载源码包:https://www.php.net/downloads.php步骤:1、解压命令:tar -xjvf php.tar.
- 简述和GNU一样,YAML是一个递归着说“不”的名字。不同的是,GNU对UNIX说不,YAML说不的对象是XML。YAML不是XML。为什么
- ASP正则表达式,RegExp对象提供简单的正则表达式支持功能。RegExp对象的用法: Function RegExpTest(
- 分析当前用户下所有表的记录总数保证好用!begin dbms_utility.analyze_schema(user,'COMPUT
- 一.脚本基础1.USE语句设置当前数据库。2.声明变量语法:DECLARE @变量名 变量类型在声明变量后,给变量赋值之前,变量的值为NUL
- 一、避免Firefox 背景图不显示的兼容问题,定义background 属性,先后顺序不能随意变动。background : backgr
- MySQL从5.1开始支持event功能,类似oracle的job功能。有了这个功能之后我们就可以让MySQL自动的执行数据汇总等功能,不用
- 本文实例讲述了php中debug_backtrace、debug_print_backtrace和匿名函数用法。分享给大家供大家参考。具体分
- string操作在编程中具有极高的频率,那么string中有哪些有用的方法呢?使用strings直接操作Comparefunc Compar
- 在Windows系统中用“Ctrl+C”和“Ctrl+V”就可以完成复制、粘贴工作,是不是很爽?其实使用a标签的accesskey属性也可以
- 1、HKEY_LOCAL_MACHINE\SYSTEM\ControlSet001\Services\Eventlog\Applicatio
- 一. 字符串生活中我们经常坐大巴车,每个座位一个编号,一个位置对应一个下标。 字符串中也有下标,要取出字符串中的部分数据,可以用下标取。py
- 语法df.drop_duplicates(subset = None,
- 本文记录,如何使用 Python 来抓取,图片或者文件的,创建日期,修改日期1. 读取照片创建日期(._getexif())from PIL