可迭代对象和迭代器是经常碰到但又很容易混淆的两个概念,所以今天小编跟大家深入剖析一下可迭代对象和迭代器的区别。认真看完本文,你将收获:
事不宜迟,我们马上开始吧!
要理解可迭代对象,那首先要搞清楚迭代的概念。关于迭代,维基百科是这样子定义的:
迭代是重复反馈过程的活动,其目的通常是为了接近并到达所需的目标或结果。每一次对过程的重复被称为一次“迭代”,而每一次迭代得到的结果会被用来作为下一次迭代的初始值。
从这个定义中,我们大概可以知道迭代是对某一个过程的重复。其实在程序中,迭代也是类似的,它是一种遍历集合元素的方式,请看下面的示例1。
# 示例1 for i in [1,2,3]: print(i)
输出结果:
1 2 3
在示例1中,解释器重复地从列表中取出元素并打印,直到遍历结束为止,这就是一个迭代的过程。可见,可迭代对象可以在for循环中遍历元素。
那什么样的对象才是一个可迭代对象?事实上,只要实现 iter 方法或者实现 __ getitem __方法而且其参数从0开始索引,那么该对象就是可迭代对象,请看示例2。
#示例2 class Vector(object): def __init__(self,components): self.components = list(components) def __iter__(self): return iter(self.components) V1 = Vector([1,2,3]) for i in V1: print(i)
输出结果:
1 2 3
从示例2中可见,Vector类实现了 __ iter __方法,解释器可以从Vector类对象中重复地取出元素并打印。如果要检查某一个对象是否为可迭代对象,其实可以使用isinstance( )函数,该函数用于判断对象是否为某一类型,但是用这个函数判断不一定准确(原因后面会说到)。
from collections import Iterable print(isinstance(V1,Iterable))#True
如果我们只是实现了__ getitem __ ()方法,情况又会怎么样呢?请看示例3。
# 示例3 from collections import Iterable class Vector(object): def __init__(self,components): self.components = list(components) def __getitem__(self,index): return self.components[index] V1 = Vector([1,2,3]) for i in V1: print(i) print(isinstance(V1,Iterable))
输出结果:
1 2 3 Flase
从示例3中可看到,Vector实现了__ getitem__方法,解释器可以对V1进行迭代并打印元素,但是!使用isinstance()判断时,返回的结果居然是False。明明可以使用for循环来迭代元素,为什么是判断是Flase呢?事实上,如果可迭代对象只是实现了__ getitem __ 的话,abc.Iterable是不考虑该方法的,这便导致了isinstance()判断不准确。更准确的方法应该是调用iter()函数,如果该对象不可迭代,就会抛出TypeError的错误。我们尝试使用iter()来判断一下。
# 示例4 print(iter(V1)) #<iterator object at 0x000001B262E35518> #去掉__getitem__方法后 print(iter(V1)) #TypeError: 'Vector' object is not iterable
从示例4中可以看到,对于可迭代对象,iter()会返回< iterator object at xxxx >。当去掉__ getitem __ ()方法后再检查时,便抛出TypeError错误。iter()函数用于生成一个迭代器,也就是说可以返回一个迭代器的就是一个可迭代对象。
该对象之所以能迭代,是因为实现了__iter__()方法。当使用for循环时候,解释器会检查对象是否有__ iter__ ()方法,有的话就是调用它来获取一个迭代器。所以没有__ iter__ ()方法但实现了__ getitem __ (),解释器会创建一个迭代器,尝试从0开始按顺序遍历元素。如果尝试失败,Python便会抛出TypeError错误。
那么Python内置类型中究竟有哪些可迭代对象呢?我们一起盘点一下吧。
其实盘点出来的都是序列,所以说任何序列都是可迭代的对象, 其原因在于他们至少都会实现__ getittem __ 方法(序列都可以通过索引获取元素)。
在介绍可迭代对象时候说到,当使用for循环时候,解释器会检查对象是否有__ iter __ ()方法,有的话就是调用它来获取一个迭代器。那么究竟什么是迭代器呢?
其实迭代器是实现了__iter__方法和__next__方法的对象。__ iter__ 方法用于返回迭代器本身,而__ next __ 用于返回下一个元素。我们自定义一个迭代器,以斐波那契数列为例说明一下其内部的执行情况,看示例5。
# 示例5 import itertools class Fib: def __init__(self): self.pre = 0 self.cur = 1 def __iter__(self): return self def __next__(self): p = self.cur self.cur += self.pre self.pre = p return p f = Fib() a = list(itertools.islice(f,0,10)) print(a) #[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]
从示例5中__ iter__ ()返回了迭代器对象本身,以便在使用可迭代对象的地方(如for循环中)使用迭代器,而__ next __ ()则通过计算返回下一个元素。我们再一起看看下面的示例6。
#示例6 >>>s = 'ABCD' >>>it = iter(s) >>>while True:print(next(it)) A B C D --------------------------------------------------------------------------- StopIteration Traceback (most recent call last) <ipython-input-4-d09d5cde4495> in <module>() ----> 1 while True:print(next(it)) StopIteration: >>> list(it) [] >>>list(iter(s)) ['A','B','C','D']
在示例6中先定义一个字符串的可迭代对象,通过iter()函数返回一个迭代器(会自动调用对象的__ iter__ 方法),然后在循环中通过next()取值并打印(会自动调用对象 __ next __()方法),通过next()方法一个个地遍历可迭代对象中的元素,当遍历结束,便会抛出StopIteratioin异常,这时迭代器也没用了,如果要再次迭代,就要使用iter()函数重新构建迭代器。
通过示例5和示例6,我们可知道迭代器是一个可以记住遍历位置的对象,其内部有一个状态用于记录迭代所在的位置,以便下次迭代时候能取出正确的元素。迭代器就像一个懒人一样,当你需要数据时候才会返回给你,否则就在等待下一次的调用。
如果要检查某个对象是否为迭代器,最好的方式是使用isinstance( )函数,见示例7。
# 示例7 from collections import Iterator f = Fib() print(isinstance(f,Iterator)) #True
好了,说了那么多,究竟迭代器哪些用处呢?其实在Python语言内部,迭代器用于支持:
以上就是小编今天跟大家分享的内容了,如果有什么疑问记得联系小编哦~
公众号:CVpython,专注于分享Python和计算机视觉,我们坚持原创,不定期更新,希望文章对你有帮助,快点扫码关注吧。