Python中Iterator迭代器的使用杂谈
作者:TypingQuietly 发布时间:2023-11-23 03:49:30
迭代器是一种支持next()操作的对象。它包含一组元素,当执行next()操作时,返回其中一个元素;当所有元素都被返回后,生成一个StopIteration异常。
>>>a=[1,2,3]
>>>ia=iter(a)
>>>next(ia)
1
>>>next(ia)
2
>>>next(ia)
3
>>>next(ia)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
ite()可以接受多种Python对象为参数,比如list,tuple, dict, set等,并将其转化为迭代器。迭代器可以用于for语句或in语句中。很多常用操作也是支持迭代器的,比如sum(), max()等。
>>> b=[4,5,6]
>>> ib=iter(b)
>>> for x in ib:
... print(x)
...
4
5
6
>>> ic=iter(b)
>>> sum(ic)
15
>>> id=iter(b)
>>> max(ic)
6
毋庸置疑,迭代器有很多好处:
1.“流式”数据处理方式减少内存消耗:
比如处理文件,一下猛地把全部数据全部取出来放到内存里面进行处理会导致程序消耗大量内存,有时甚至没法做到,一般我们会一部分一部分的对文件内容进行处理:
for text_line in open("xx.txt"):
print text_line
2.或者对xml文件进行处理的时候:
tree = etree.iterparse(xml, ['start', 'end'])
for event, elem in tree:
if event == "end"
result = etree.tostring(elem)
elem.clear()
print result
内置函数open返回的file对象和etree.iterparse序列化的xml tree都是可迭代对象,能够让我们渐进式地对文件的内容进行处理。
3.支持方便用for语句对数据进行消费:
python内置的一些常见的像类型像数组、列表甚至字符串等都是可迭代类型,这样我们就能方便for语句这个语法糖方便对数据进行消费,不需要自己记录索引位置,人肉循环:
for i in [1, 2, 3, 4]
print i,
简单了解了一下迭代器的好处后,我们正正经经的聊聊python的迭代器模式。
在这里我们引入两个比较绕口的名词:可迭代对象和迭代器对象,个人觉得从这两个概念下手会对迭代器有比较好的理解。在放例子前先对这两个概念给一个不入流的解释:
可迭代对象:对象里面包含__iter()__方法的实现,对象的iter函数经调用之后会返回一个迭代器,里面包含具体数据获取的实现。
迭代器:包含有next方法的实现,在正确范围内返回期待的数据以及超出范围后能够抛出StopIteration的错误停止迭代。
放个例子边看边说:
class iterable_range:
def __init__(self, n):
self.n = n
def __iter__(self):
return my_range_iterator(self.n)
class my_range_iterator:
def __init__(self, n):
self.i = 0
self.n = n
def next(self):
if self.i < self.n:
i = self.i
self.i += 1
print 'iterator get number:', i
return i
else:
raise StopIteration()
例子中的iterable_range是一个可迭代对象,所以我们也能够对它用for语句来进行迭代:
temp = my_range(10)
for item in temp:
print item,
输出:
my iterator get number: 0
0
my iterator get number: 1
1
my iterator get number: 2
2
my iterator get number: 3
3
my iterator get number: 4
4
my iterator get number: 5
5
my iterator get number: 6
6
my iterator get number: 7
7
my iterator get number: 8
8
my iterator get number: 9
9
大家可以仔细地看一下输出的日志:
数据确实是“流式”处理的
iterator是真正在背后做事的人
for语句能够非常方便的迭代对象的数据。
可迭代对象其实更像是整个迭代器模式模式的上层,像一种约束一种契约一种规范,它能够保证自己能够返回一个在实际工作中干活的迭代器对象。for、sum等接受一个可迭代对象的方法都是遵循这样的规范:调用对象的__iter__函数,返回迭代器,对迭代器对象返回的每个值进行处理抑或需要一些汇总的操作。拿for举个例子:
iterator_object = iterable_object.__iter__()
while True:
try:
value = iterator_object.next()
except StopIteration:
# StopIteration exception is raised after last element
break
# loop code
print value
for这个语法糖背后的逻辑差不多就是上面例子中代码所示的那样:首先获取可迭代对象返回的迭代器对象,然后调用迭代器对象的next方法获取每个值,在获取值的过程中随时检测边界-也就是检查是否抛出了StopIteration这样的错误,如果迭代器对象抛出错误则迭代停止(note:从这个例子可以看出,对于那些接受可迭代对象的方法,如果我们传一个单纯的迭代器对象其实也是无法工作的,可能会报出类似于TypeError: iteration over non-sequence的错误)。
当然了,一般在应用过程中我们不会将他们特意的分开,我们能够稍微对迭代器对象进行修改一下,添加__iter__方法的实现,这样对象本身就既是可迭代对象也是一个迭代器对象了:
class my_range_iterator:
def __init__(self, n):
self.i = 0
self.n = n
def __iter__(self):
return self
def next(self):
if self.i < self.n:
i = self.i
self.i += 1
print 'my iterator get number:', i
return i
else:
raise StopIteration()
for item in my_range_iterator(10):
print item
输出:
my iterator get number: 0
0
my iterator get number: 1
1
my iterator get number: 2
2
my iterator get number: 3
3
my iterator get number: 4
4
my iterator get number: 5
5
my iterator get number: 6
6
my iterator get number: 7
7
my iterator get number: 8
8
my iterator get number: 9
9


猜你喜欢
- 在上一篇文章: 觉得猪八戒网左下角的文字滚动,效果不错,自己摸索了一下,以自己的方法实现了!就有这种效果,不过影响不大。Demo的影响就大了
- 本文内容会引起杀毒软件的莫名兴奋,建议先安抚杀毒软件,让杀毒软件先休息一下再继续操作安装python3.6转exe会遇到很多问题,其中部分是
- 由于pygame.movie.Movie.play() 只支持MPEG格式的视频,且 pygame版本大于1.9.5好像已经不支持这个模块了
- 可以查看mysql文件目录my.ini文件,可以找到类似于 datadir="D:/beeagle/Program Files/M
- 前言最近使用pytorch训练模型,保存模型后再次加载使用出现了一些问题。记录一下解决方案!一、torch中模型保存和加载的方式1、模型参数
- FME如何使用Python?安装FME后,在FME的安装路径中,找到 fmeobjects 文件夹(C:\Program Files\FME
- input标签checkbox,change和click绑定事件的区别我们经常在vue开发项目的过程中,遇到需要对input框使用v-mod
- 1.引言热力图的想法很简单,用颜色替换数字。现在,这种可视化风格已经从最初的颜色编码表格走了很长一段路。热力图被广泛用于地理空间数据。这种图
- 最近开始学习Python,但只限于看理论,编几行代码,觉得没有意思,就想能不能用Python编写可视化的界面。遂查找了相关资料,发现了PyQ
- 有的时候,一个 if … else … 还不够用。比如,根据年龄的划分:条件1:18岁或以上:adult条件2:6岁或以上:teenager
- 本文实例讲述了JS实现判断有效的数独算法。分享给大家供大家参考,具体如下:判断一个 9x9 的数独是否有效。只需要根据以下规则,验证已经填入
- 注:我指一个网站被第三方网站以iframe的形式调用时,被调用网站的禁止策略 和 调用网站的突破禁止策略,跟XSS麽关系,但跟clickja
- 1. 确认已经安装了NT/2000和SQL Server的最新补丁程序,不用说大家应该已经安装好了,但是我觉得最好还是在这里提醒一下。2.
- 列表是什么列表是元素的集合,存储在一个变量中。列表中存储的元素类型没有限制,根据需要动态分配和回收内存列表中的每个元素都会分配一个数字用来表
- 本文实例讲述了Python 静态方法和类方法。分享给大家供大家参考,具体如下:1. 类属性、实例属性它们在定义和使用中有所区别,而最本质的区
- async / await是ES7的重要特性之一,也是目前社区里公认的优秀异步解决方案。目前,async / await这个特性已经是sta
- 1 Git简介Git 是目前世界上最先进的分布式版本控制系统(没有之一)作用: 源代码管理为什么要进行源代码管理?
- 文本特征提取作用:对文本数据进行特征化(句子、短语、单词、字母)一般选用单词作为特征值方法一:CountVectorizersklearn.
- 概述:最近在赶毕业设计,遇到一个问题,爬虫模块我用PyQt5写了图形界面,为了将所有的输出信息都显示到图形界面上遇到了问题。先演示一下效果最
- 通过本篇内容给大家介绍一下Python实现金融数据可视化中两列数据的提取、分别画、双坐标轴、双图、两种不同的图等代码写法和思路总结。impo