12. 前 方 高能-生成器器和 生成器器表达式
本节主要内容:
- 生成器和 生成器函数
- 列列表推导式
一. 生成器什什么是 生成器. 生成器实质就是迭代器.
在python中有三种 方式来获取 生成器:
- 通过 生成器函数
- 通过各种推导式来实现 生成器
- 通过数据的转换也可以获取 生成器
首先, 我们先看 一个很简单的函数:
def func(): print("111") return 222
ret = func() print(ret)
结果:
111
222
将函数中的return换成yield就是 生成器
def func(): print("111") yield 222
ret = func() print(ret)
结果:
<generator object func at 0x10567ff68>
运 行行的结果和上 面不 一样. 为什什么呢. 由于函数中存在了了yield. 那么这个函数就是 一个 生成器函数. 这个时候. 我们再执 行行这个函数的时候. 就不再是函数的执 行行了了. 而是获取这个 生成器.如何使 用呢? 想想迭代器. 生成器的本质是迭代器. 所以. 我们可以直接执 行行__next__()来执 行行
以下 生成器.
def func(): print("111") yield 222
gener = func() # 这个时候函数不不会执 行行. 而是获取到 生成器 ret = gener.__next__() # 这个时候函数才会执 行行. yield的作 用和return 一样. 也是返回数据 print(ret)
结果:
111
222
那么我们可以看到, yield和return的效果是 一样的. 有什什么区别呢? yield是分段来执 行行 一个函数. return呢? 直接停 止执 行行函数.
def func(): print("111") yield 222 print("333") yield 444
gener = func()
ret = gener.__next__() print(ret)
ret2 = gener.__next__() print(ret2)
ret3 = gener.__next__() # 最后 一个yield执 行行完毕. 再次__next__()程序报错, 也就是说. 和return 无关了了. print(ret3)
结果:
111
Traceback (most recent call last): 222 333
File "/Users/sylar/PycharmProjects/oldboy/iterator.py", line 55, in <module>
444
ret3 = gener.__next__() # 最后 一个yield执 行行完毕. 再次__next__()程序报错, 也
就是说. 和return 无关了了. StopIteration
当程序运 行行完最后 一个yield. 那么后 面继续进 行行__next__()程序会报错.
好了了 生成器说完了了. 生成器有什什么作 用呢? 我们来看这样 一个需求. 老男孩向JACK JONES订
购10000套学 生服. JACK JONES就比较实在. 直接造出来10000套衣服.
def cloth():
lst = []
for i in range(0, 10000): lst.append(" 衣服"+str(i))
return lst cl = cloth()
但是呢, 问题来了了. 老男孩现在没有这么多学 生啊. 一次性给我这么多. 我往哪 里里放啊. 很尴尬啊. 最好的效果是什什么样呢? 我要1套. 你给我1套. 一共10000套. 是不是最完美的.
def cloth():
for i in range(0, 10000): yield " 衣服"+str(i)
cl = cloth() print(cl.__next__()) print(cl.__next__()) print(cl.__next__()) print(cl.__next__())
区别: 第 一种是直接 一次性全部拿出来. 会很占 用内存. 第 二种使 用 生成器. 一次就 一个. 用多少 生成多少. 生成器是 一个 一个的指向下 一个. 不会回去, __next__()到哪, 指针就指到哪 儿.下 一次继续获取指针指向的值.
接下来我们来看send 方法, send和__next__() 一样都可以让 生成器执 行行到下 一个yield.
def eat(): print("我吃什什么啊") a = yield "馒头" print("a=",a)
b = yield " 大饼" print("b=",b) c = yield " 韭菜盒 子" print("c=",c)
yield "GAME OVER"
gen = eat() # 获取 生成器 ret1 = gen.__next__() print(ret1)
ret2 = gen.send("胡辣汤") print(ret2)
ret3 = gen.send("狗粮") print(ret3)
ret4 = gen.send("猫粮") print(ret4)
send和__next__()区别:
- send和next()都是让 生成器向下走 一次
- send可以给上 一个yield的位置传递值, 不能给最后 一个yield发送值. 在第 一次执 行行 生
成器代码的时候不能使 用send()
生成器可以使 用for循环来循环获取内部的元素:
def func(): print(111) yield 222 print(333) yield 444 print(555) yield 666
gen = func() for i in gen:
print(i)
结果:
111
222
333
444
555
666
二. 列列表推导式, 生成器表达式以及其他推导式 首先我们先看 一下这样的代码, 给出 一个列列表, 通过循环, 向列列表中添加1-13 :
lst = []
for i in range(1, 15): lst.append(i)
print(lst)
替换成列列表推导式:
lst = [i for i in range(1, 15)] print(lst)
列列表推导式是通过 一 行行来构建你要的列列表, 列列表推导式看起来代码简单. 但是出现错误之后很难排查.
列列表推导式的常 用写法:
[ 结果 for 变量量 in 可迭代对象]
例例. 从python1期到python14期写入列列表lst:
lst = ['python%s' % i for i in range(1,15)] print(lst)
我们还可以对列列表中的数据进 行行筛选
筛选模式:
[ 结果 for 变量量 in 可迭代对象 if 条件 ]
# 获取1-100内所有的偶数 lst = [i for i in range(1, 100) if i % 2 == 0] print(lst)
生成器表达式和列列表推导式的语法基本上是 一样的. 只是把[]替换成()
gen = (i for i in range(10)) print(gen)
结果:
<generator object <genexpr> at 0x106768f10>
打印的结果就是 一个 生成器. 我们可以使 用for循环来循环这个 生成器:
gen = ("麻花藤我第%s次爱你" % i for i in range(10)) for i in gen:
print(i)
生成器表达式也可以进 行行筛选:
# 获取1-100内能被3整除的数 gen = (i for i in range(1,100) if i % 3 == 0) for num in gen:
print(num)
# 100以内能被3整除的数的平 方 gen = (i * i for i in range(100) if i % 3 == 0) for num in gen:
print(num)
# 寻找名字中带有两个e的 人的名字
names = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven', 'Joe'],
['Alice', 'Jill', 'Ana', 'Wendy', 'Jennifer', 'Sherry', 'Eva']]
# 不不 用推导式和表达式 result = []
for first in names: for name in first:
if name.count("e") >= 2: result.append(name)
print(result)
# 推导式
gen = (name for first in names for name in first if name.count("e") >= 2) for name in gen:
print(name)
生成器表达式和列列表推导式的区别:
- 列列表推导式比较耗内存. 一次性加载. 生成器表达式 几乎不占 用内存. 使 用的时候才分配和使 用内存
- 得到的值不 一样. 列列表推导式得到的是 一个列列表. 生成器表达式获取的是 一个 生成器.
举个栗 子.
同样 一篮 子鸡蛋. 列列表推导式: 直接拿到 一篮 子鸡蛋. 生成器表达式: 拿到 一个老 母鸡. 需要鸡蛋就给你下鸡蛋.
生成器的惰性机制: 生成器只有在访问的时候才取值. 说 白了了. 你找他要他才给你值. 不找他要. 他是不会执 行行的.
def func(): print(111) yield 222
| g = func() # 生成器 g | 
 | |
| g1 | = (i for i in g) # 生成器 g1. 但是g1的数据来源于g | |
| g2 | = (i for i in g1) | # 生成器 g2. 来源g1 | 
print(list(g)) # 获取g中的数据. 这时func()才会被执 行行. 打印111.获取到222. g完毕. print(list(g1)) # 获取g1中的数据. g1的数据来源是g. 但是g已经取完了了. g1 也就没有数据了了 print(list(g2)) # 和g1同理理
深坑==> 生成器. 要值得时候才拿值.
字典推导式:
根据名字应该也能猜到. 推到出来的是字典
# 把字典中的key和value互换 dic = {'a': 1, 'b': '2'}
new_dic = {dic[key]: key for key in dic} print(new_dic)
# 在以下list中. 从lst1中获取的数据和lst2中相对应的位置的数据组成 一个新字典 lst1 = ['jay', 'jj', 'sylar'] lst2 = ['周杰伦', '林林俊杰', '邱彦涛']
dic = {lst1[i]: lst2[i] for i in range(len(lst1))} print(dic)
集合推导式:
集合推导式可以帮我们直接 生成 一个集合. 集合的特点: 无序, 不重复. 所以集合推导式 自带去重功能
lst = [1, -1, 8, -8, 12]
# 绝对值去重 s = {abs(i) for i in lst} print(s)
总结: 推导式有, 列列表推导式, 字典推导式, 集合推导式, 没有元组推导式 生成器表达式: (结果 for 变量量 in 可迭代对象 if 条件筛选)
生成器表达式可以直接获取到 生成器对象. 生成器对象可以直接进 行行for循环. 生成器具有惰性机制.
一个 面试题. 难度系数500000000颗星:
def add(a, b): return a + b
def test():
for r_i in range(4): yield r_i
g = test()
for n in [2, 10]:
g = (add(n, i) for i in g)
print(list(g))
友情提 示: 惰性机制, 不到最后不会拿值这个题要先读 一下. 然后 自 己分析出结果. 最后 用机器跑 一下.
# def func():#     print("我是周杰伦")#     yield "昆凌"  # 函数中包含了yield, 当前这个函数就不再是普通的函数了. 是生成器函数#     print("我是王力宏")#     yield "李云迪???"#     print("我是笛卡尔积")#     yield "笛卡尔积是谁"    # print("你好啊") # 最后一个yield之后如果再进行__next__() 会报错# g = func()# print(g.__next__())# print(func().__next__())## g1 = func()# g2 = func()# print(g1.__next__())# print(g1.__next__())## print("==============")# print(g2.__next__())## g = func()  # 通过函数func()来创建一个生成器# print(g.__next__()) # 周杰伦# print(g.__next__()) # 王力宏# print(g.__next__()) # 笛卡尔积# print(g.__next__())# return 直接返回结果. 结束函数的调用# yield 返回结果.可以让函数分段执行## def func():#     lst = []#     for i in range(1,100001):#         lst.append("衣服%s" % i)#     return lst## def gen():#     i = 1#     while i < 100001:#         yield "衣服%s" % i#         i = i + 1# g = gen()# print(g.__next__())# print(g.__next__())# print(g.__next__())# print(g.__next__())# print(g.__next__())# print(g.__next__())## def func():#     yield 11#     yield 22#     yield 33#     yield 44### g = func()  # 拿到的是生成器. 生成器的本质是迭代器. 迭代器可以被迭代 生成器可以直接for循环## for i in g:#     print(i)    # 本质上执行的是__next__()## it = g.__iter__()# while True:#     try:#         print(it.__next__())#     except StopIteration:#         break
# def func():#     print("大碴粥")#     a = yield "11"#     print(a)#     print("狗不理")#     b = yield "22"#     print(b)#     print("大麻花")#     c = yield "33"#     print(c)## g = func()# print(g.__next__())# print(g.send(1))# print(g.send(2))# print(g.send(3))# __next__() 可以让生成器向下执行一次# send() 也可以让生成器向下执行一次, 给上一个yield传一个值, 第一个不能用send(). 最后一个也不要传值def eat():    print("我吃什么啊")    a =  yield  "馒头"    print("a=",a)    b =  yield  "大饼"    print("b=",b)    c =  yield  "韭菜盒子"    print("c=",c)    yield  "GAME OVER"gen = eat()      # 获取⽣成器ret1 = gen. __next__ ()print(ret1)ret2 = gen.send("胡辣汤")print(ret2)ret3 = gen.send("狗粮")print(ret3)ret4 = gen.send("猫粮")print(ret4)def func():    yield 11    yield 22    yield 33    yield 44g = func()lst = list(g)   # 可迭代对象print(lst)
# 生成列表 里面装1-14的数据# lst = []# for i in range(1,15):#     lst.append("python%s" % i)# print(lst)# 列表推倒式; 最终给你的是列表# 语法 [最终结果(变量) for 变量 in 可迭代对象]# lst = [i for i in range(1,15)]# print(lst)# [最终结果 for 变量 in 可迭代对象 if 条件]lst = [i for i in range(1,101) if i%2==0]print(lst)# 1. 获取1-100内能被3整除的数# lst = [i for i in range(1,101) if i % 3 == 0]# 2. 100以内能被3整除的数的平方# lst = [i*i for i in range(1,101) if i % 3 == 0]# 3. 寻找名字中带有两个e的⼈的名字# names = [['Tom', 'Billy', 'Jefferson' , 'Andrew' , 'Wesley' , 'Steven' ,# 'Joe'],['Alice', 'Jill' , 'Ana', 'Wendy', 'Jennifer', 'Sherry' , 'Eva']]# lst = [name for first in names for name in first if name.count("e") == 2]# print(lst)## lst = ["衣服%s" % i for i in range(10000)]
# g = (i for i in range(10))# print(list(g))# gen = ("麻花藤我第%s次爱你" % i for i in  range(10))# for i in  gen:#     print(i)# 生成器的惰性机制# def func():#     print(111)#     yield  222# g = func()# g1 = (i  for i in  g)# g2 = (i  for i in  g1)## print(list(g))# print(list(g1))# print(list(g2))
# dic = {"a":"b", "c":"d"}# # 把字典中的key:value互换 .{"b":"a", "d":"c"}# new_dic = {dic[key]:key for key in dic}# print(new_dic)# lst1 = ["alex", "wusir", "taibai", "ritian"]# lst2 = ['sb', "很色", "很白", "很牛"]# # {"alex":"sb", "wusir":"很色"}## dic = { lst1[i]:lst2[i] for i in range(len(lst1))}# print(dic)
lst = ["马化腾", "马化腾", "王建忠", "张建忠", "张建忠", "张雪峰", "张雪峰"]s = {i for i in lst}    # 集合推倒式print(s)作业:
def add(a, b): return a + bdef gen(): for r_i in range(4): yield r_ig = gen()for n in [2, 10]: g = (add(n, i) for i in g)print(list(g))
'''         用列表推到式做下面小题1.过滤掉长度小于3的字符串列表,并将剩下的转换成大写字母2.求(x,y)其中x是0-5之间的偶数,y是0-5之间的奇数组成的元组列表3.求M中3,6,9组成的列表M=[[1,2,3],[4,5,6],[7,8,9]]4.求出50以内能被3整除的数的平方,并放入到一个列表中5.构建一个列表[(0,1),(1,2),(2,3),(3,4),(4,5),(5,6)]6.构建一个列表:[0,2,4,6,8,10,12,14,16,18]7.有一个列表l1 = ['alex', 'WuSir', '老男孩', '太白']将其构造成这种列表['alex0', 'WuSir1', '老男孩2', '太白3']8.# x = {#     'name':'alex',#     'Values':[{'timestamp':1517991992.94,'values':100,},#         {'timestamp': 1517992000.94,'values': 200,},#         {'timestamp': 1517992014.94,'values': 300,},#         {'timestamp': 1517992744.94,'values': 350},#         {'timestamp': 1517992800.94,'values': 280}#     ],}'''# 1.过滤掉长度小于3的字符串列表,并将剩下的转换成大写字母# lst = ['xx','sads','haha','ww','kk','taibai']# first = [i for i in lst  if i.__len__() >=3]# print(first)# 2.求(x,y)其中x是0-5之间的偶数,y是0-5之间的奇数组成的元组列表# lst=[ (k,i) for k in range(6) if k % 2==0 for i in range(6) if i % 2 == 1]# print(lst)# 3.求M中3,6,9组成的列表M=[[1,2,3],[4,5,6],[7,8,9]]M = [[1,2,3],[4,5,6],[7,8,9]]