深入浅析Python中的迭代器
作者:HDWK 发布时间:2021-02-20 03:36:43
目录结构:
contents structure [-]
在开始文章之前,先贴上一张Iterable、Iterator与Generator之间的关系图:
1. Iterator VS Iterable
迭代器(Iterator)
迭代器是实现了迭代器协议的类对象,迭代器协议规定了迭代器类必需定义__next()__方法。当对迭代器对象调用next()方法时,对象会去调用__next()__计算迭代器的返回值。
可迭代对象(Iterable)
可迭代对象可以是任何对象,不一定是能返回迭代器的数据结构。一个可迭代对象会直接或间接性的调用这两个方法__iter()__和__next()__;其中__iter()__方法只能返回迭代器对象,__next()__则供给迭代器进行调用。
通常情况下,可迭代类都会实现__iter()__和__next()__,并且__iter()__返回它自己,换句话说,该类即是迭代器又是可迭代类。
下面的代码展示了迭代器和可迭代器对象之间的差别:
a_set = {1, 2, 3}#定义set数据类型,set是可迭代类型
b_iterator = iter(a_set)#得到set的迭代器
#Output: 1
print(next(b_iterator))
#Output: <class 'set'>
print(type(a_set))
#Output: <class 'set_iterator'>
print(type(b_iterator))
从结果可以看出a_set是一个可迭代类型(set类型),b_iterator是一个迭代器(set_iterator),它们两个是完全不一同的类型。
下面的自定义了一个迭代器:
class Series(object):
def __init__(self, low, high):
self.current = low
self.high = high
def __iter__(self):
return self
def __next__(self):
if self.current > self.high:
raise StopIteration
else:
self.current += 1
return self.current - 1
n_list = Series(1,10)
print(list(n_list))
从上面的代码可以看出,__iter__返回了迭代器本身。__next__返回迭代器的下一个值,如果没有下一个返回值那么会抛出StopIteration异常。如果没有在合适的位置抛出StopIteration异常结束迭代,那么在某些循环语句中(例如:for loop),将会形成死循环,所以在__next__中必需要在合适位置添加退出语句(抛出StopIterator异常)。
2.Itertools 模块
Itertools是Python的内置模块,其中包含了能够创建迭代器的函数。简而言之,它提供了许多能够与迭代器交互的方法。
下面是我们使用Itertools模块中count函数的案例:
from itertools import count
sequence = count(start=0, step=1)
while(next(sequence) <= 10):
print(next(sequence),end=" ")
输出:
Itertools中的cycle函数可以创建无限迭代器,例如:
from itertools import cycle
dessert = cycle(['Icecream','Cake'])
count = 0
while(count != 4):
print('Q. What do we have for dessert? A: ' + next(dessert))
count+=1
输出:
Q. What do we have for dessert? A: Icecream
Q. What do we have for dessert? A: Cake
Q. What do we have for dessert? A: Icecream
Q. What do we have for dessert? A: Cake
关于更多itertools模块的使用, 可以参见python文档 。
3.生成器(Generator)
生成器可以说是迭代器的亲兄弟,生成器允许我们像上面那样写迭代器而不用额外定义__iter__()和__next__()方法。
看下面的案例:
def series_generator(low, high):
while low <= high:
yield low
low += 1
n_list = []
for num in series_generator(1,10):
n_list.append(num)
print(n_list)
如果一个方法中出现了yield关键字,那么该方法就是一个生成器。生成器中没有return语句,函数的返回值实际上是一个generator。当循环开始执行到yield语句后,low的值会被扩展到要返回的generator中。当下一次循环到达yield语句时,generator会从上一次停止的地方恢复执行,并且将最新的low值添加到generator中。循环一直运行下去,直到low>high退出循环。
生成器支持延迟计算,只有当去取生成器中的值时才会计算。
例如:
def test():
print("进入test函数")
for i in range(2):
print("yield number ",i)
yield i
if "__main__" == __name__:
print("开始调用test")
res = test()
print("结束调用test")
next(res)
next(res)
输出:
开始调用test
结束调用test
第一次next(res)
进入test函数
yield number 0
第二次next(res)
yield number 1
从结果可以看出,只有使用next调用迭代器时(使用for,while循环也可以),才会去执行迭代器函数中的内容。
python中生成器可以分为生成器函数和生成器表达式,生成器函数和生成器表达式是两种不同的类型。
生成器函数是一个函数体中有yield关键字的,我们上面定义的test就是生成器函数。
生成器表达式的使用比较受限制,一个生成器表达式返回一个生成器。下面是一个使用生成器表达式的案例:
squares = (x * x for x in range(1,10))
print(type(squares))
print(list(squares))
输出:
<class 'generator'>
[1, 4, 9, 16, 25, 36, 49, 64, 81]
生成器的效率是非常高的,生成器可以更好的利用内存和CPU的使用效率,并且通常生成器的代码都比较少,这使用生成器的代码非常好容易理解。应此应该尽量多的在代码中使用生成器
参考文档
https://www.datacamp.com/community/tutorials/python-iterator-tutorial
总结
以上所述是小编给大家介绍的Python中的迭代器,网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
来源:https://www.cnblogs.com/HDK2016/p/10970947.html
猜你喜欢
- MySQL提供标准的SQL模式匹配,以及一种基于象Unix实用程序如vi、grep和sed的扩展正则表达式模式匹配的格式。标准的SQL模式匹
- 本文实例讲述了Python实现简单拆分PDF文件的方法。分享给大家供大家参考。具体如下:依赖pyPdf处理PDF文件切分pdf文件使用方法:
- 关于《回访确认》这件事情,在我blog和5Gme的回复里普遍出现这么几个疑问:1、下了订单却放弃支付的心理因素是什么?2、回访电话可以促进订
- 背景使用python操作一批同样分辨率的图片,合并为tiff格式的文件。由于opencv主要用于读取单帧的tiff文件,对多帧的文件支持并不
- Json模块dumps、loads、dump、load函数介绍1、json.dumps() json.dumps()用于将dict
- 新手在配置pytorch过程中总会或多或少遇到些问题,同时网上关于pytorch的环境配置琳琅满目,不知道应该按照哪个配置,这里笔者记录一下
- 1. js的数据类型1.1 js引入方式<!DOCTYPE html><html lang="en"&
- 今天看YUI的视频教程,YUI的工程师介绍的一款在线的图片压缩工具,也许你用过,也许没有,不过我这里强烈推荐大家用一下,我用smush.it
- 一、线性回归的理论1)线性回归的基本概念线性回归是一种有监督的学习算法,它介绍的自变量的和因变量的之间的线性的相关关系,分为一元线性回归和多
- Windows中升级MySQL应采取的步骤:1. 进行升级前你应先备份当前的MySQL安装。2. 下载最新Windows版MySQL。3.
- HTML5,被传为Flash 的杀手,是一种用于web 应用程序开发、具有变革意义的网络技术。HTML 5提供了一些新的元素和属性,其中有些
- Python信息抽取之乱码解决办法就事论事,直说自己遇到的情况,和我不一样的路过吧,一样的就看看吧信息抓取,用python,beautifu
- 解决2个问题:1.身份证之类的文本数据自动转为科学计数法的问题。2.中文乱码的问题excel从web页面上导出的原理。当我们把这些数据发送到
- 今天来研究python中moviepy模块的用途近来有大量处理视频的需求,常会碰到一个问题是下载的视频音量过小,会需要将它调大声,虽然有在线
- Django提供了一个新的类来帮助管理分页数据,这个类存放在django/core/paginator.py.它可以接收列表、元组或其它可迭
- 方法一:巧用sum函数将list列表与一个空列表相加,就能把嵌套列表合并成一个a=[[1],[2],[3],[4],[5]]merge=su
- 代码如下:title=request("title") title=replace(title,"chr(3
- 前言python内建函数指的是python自带的函数,这种函数不需要定义,并且不同的内建函数具有不同的功能,可以直接使用。A类abs() 函
- 如下所示:pd.to_datetime(data[data['last_O_XLMC']==data['O_XLMC
- 今天以一个表单的自动提交,来进一步学习selenium的用法练习目标0)运用selenium启动firefox并载入指定页面(这部分可查看本