通过列表⽣成式,我们可以直接创建⼀个列表。但是,受到内存限制,列表容量肯定是有限的。⽽且,创建⼀个包含100万个元素的列表,不仅占⽤很⼤的存储空间,如果我们仅仅需要访问前⾯⼏个元素,那后⾯绝⼤多数元素占⽤的空间都⽩⽩浪费了。所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从⽽节省⼤量的空间。在Python中,这种⼀边循环⼀边计算的机制,称为⽣成器:generator。
创建生成器,列表生成式,我们知道,只要将最外一层的中括号,改为小括号。
>>> # python交互式环境 >>> y = [x + 1 for x in range(10) if x % 2 == 0] >>> y [1, 3, 5, 7, 9] >>> g = (x + 1 for x in range(10) if x % 2 == 0) >>> g <generator object <genexpr> at 0x0000020EF13E79C8>
创建 y 和 g 的区别仅在于最外层的 [ ] 和 ( ) , y 是⼀个列表,⽽ g 是⼀个⽣成器。我们可以直接打印出L的每⼀个元素,但我们怎么打印出g的每⼀个元素呢?如果要⼀个⼀个打印出来,可以通过 next() 函数获得⽣成器的下⼀个返回值:
>>> next(g) 1 >>> next(g) 3 >>> next(g) 5 >>> next(g) 7 >>> next(g) 9 >>> next(g) Traceback (most recent call last): File "<pyshell#13>", line 1, in <module> next(g) StopIteration
也可以通过循环打印出来
>>> g = (x + 1 for x in range(10) if x % 2 == 0) >>> for i in g: print(i) ... 1 3 5 7 9
⽣成器保存的是算法,每次调⽤ next(g) ,就计算出 g 的下⼀个元素的值,直到计算到最后⼀个元素,没有更多的元素时,抛出 StopIteration 的异常。当然,这种不断调⽤ next() 实在是太繁琐了,虽然是点一次出现一次,但正确的⽅法是使⽤ for 循环,因为⽣成器也是可迭代对象。所以,我们创建了⼀个⽣成器后,基本上永远不会调⽤next() ,⽽是通过 for 循环来迭代它,并且不需要关心StopIteration 异常。所以,我们创建了一个生成器后,基本上不会调用 next() ,而是通过 for 循环来迭代它,并且不需要关心StopIteration 的错误。generator非常强大。如果推算的算法比较复杂,用类似列表生成式的 for 循环无法实现的时候,还可以用函数来实现。比如,著名的斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到:1, 1, 2, 3, 5, 8, 13, 21, 34, ...斐波拉契数列用列表生成式写不出来,但是,用函数把它打印出来却很容易:
代码如下:
def fib_a(times): # 初始化 n = 0 a, b = 0, 1 while n < times: print(b) a, b = b, a + b n += 1 return 'done' z = fib_a(5) print(z) # 打印结果: 1 1 2 3 5 done
仔细观察,可以看出,fib_a函数实际上是定义了斐波拉契数列的推算规则,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator。也就是说,上面的函数和generator仅一步之遥。要把 fib 函数变成generator,只需要把 print(b) 改为 yield(b) 就可以了:
def fib_a(times): # 初始化 n = 0 a, b = 0, 1 while n < times: yield(b) a, b = b, a + b n += 1 return 'done'
在上⾯fib 的例⼦,我们在循环过程中不断调⽤ yield ,就会不断中断。当然要给循环设置⼀个条件来退出循环,不然就会产⽣⼀个⽆限数列出来。同样的,把函数改成generator后,我们基本上从来不会⽤ next() 来获取下⼀个返回值,⽽是直接使⽤ for 循环来迭代:
for i in fib_a(5): print(i) 1 1 2 3 5
但是⽤for循环调⽤generator时,发现拿不到generator的return语句的返回值。如果想要拿到返回值,必须捕获StopIteration错误,返回值包含在StopIteration的value中
⽣成器是这样⼀个函数,它记住上⼀次返回时在函数体中的位置。对⽣成器函数的第⼆次(或第 n 次)调⽤跳转⾄该函数中间,⽽上次调⽤的所有局部变量都保持不变。⽣成器不仅“记住”了它数据状态;⽣成器还“记住”了它在流程控制构造(在命令式编程中,这种构造不只是数据值)中的位置。
⽣成器的特点: