0

0

yield 关键字的作用与生成器工作流程

幻影之瞳

幻影之瞳

发布时间:2025-09-03 18:31:01

|

271人浏览过

|

来源于php中文网

原创

yield关键字使函数变为生成器,实现暂停执行、按需返回值并保存状态,相比列表更节省内存,适用于处理大数据、惰性计算和无限序列,yield from则简化了子生成器委托,提升代码简洁性与可维护性。

yield 关键字的作用与生成器工作流程

yield
关键字在 Python 中扮演着一个非常独特的角色,它能将一个普通函数“转化”为生成器(generator)。简单来说,当你在一个函数中使用
yield
语句时,这个函数就不会立即执行完并返回一个单一结果,而是变成一个迭代器,每次被请求时才“暂停”执行并“吐出”一个值,然后记住它当前的所有状态,等待下一次被唤醒时从上次暂停的地方继续执行。这对于处理大量数据或构建惰性计算序列来说,是极其高效且优雅的解决方案。

yield
关键字的作用与生成器工作流程

在我看来,

yield
关键字是 Python 语言中一个非常精妙的设计,它彻底改变了函数的工作模式。一个包含
yield
的函数,当你调用它时,它并不会像普通函数那样直接运行函数体内的代码,而是返回一个特殊的迭代器对象,也就是我们常说的“生成器对象”。

这个生成器对象才是真正的工作者。当你对它调用

next()
方法(或者在
for
循环中迭代它)时,函数体内的代码才会开始执行,直到遇到第一个
yield
语句。此时,函数会“暂停”执行,将
yield
后面的值作为结果返回。更关键的是,它会把当前函数的所有局部变量和执行状态都保存下来。

当生成器对象再次被请求下一个值时(再次调用

next()
),函数会从上次暂停的地方,也就是上次
yield
语句之后的那一行,继续执行。这个过程会一直重复,直到函数体执行完毕,或者遇到
return
语句(此时生成器会抛出
StopIteration
异常,表示没有更多的值了)。

这种“按需生成”的模式,与传统的“一次性生成所有结果并存储”的模式形成了鲜明对比。它最直接的好处就是极大地节省内存。想象一下,如果你需要处理一个亿万级别的数据序列,把它全部加载到内存中几乎是不可能的。但如果用生成器,我们每次只需要处理一个数据项,内存占用就能保持在一个非常低的水平。

def simple_generator():
    print("开始生成...")
    yield 1
    print("生成了1,继续...")
    yield 2
    print("生成了2,快结束了...")
    yield 3
    print("生成完毕。")

# 调用函数,得到的是一个生成器对象
gen = simple_generator()

# 每次调用next(),函数才执行一部分
print(next(gen)) # 输出:开始生成... 1
print(next(gen)) # 输出:生成了1,继续... 2
print(next(gen)) # 输出:生成了2,快结束了... 3

# 再次调用会抛出StopIteration
# print(next(gen)) # 输出:生成了3,快结束了... 生成完毕。 StopIteration

你看,这个例子清晰地展示了

yield
如何控制函数的执行流。每次
next()
都像给生成器“打了一针兴奋剂”,让它向前走一步,吐出一个值,然后再次“冬眠”。

生成器与普通函数有何本质区别?为何选择生成器而非列表?

这问题问到了点子上,也是很多初学者容易混淆的地方。在我看来,生成器和普通函数最根本的区别在于它们的执行模型内存管理策略

普通函数是“一次性”的。当你调用一个普通函数时,它会从头到尾执行完毕,然后返回一个(或零个)结果。函数执行过程中产生的任何局部变量,在函数返回后就都“烟消云散”了。它就像一个短跑运动员,冲刺到底,然后休息。

而生成器函数则更像一个“马拉松运动员”,它会跑一段,停下来喘口气(

yield
),把当前跑到哪儿了、身体状态如何都记下来,然后把阶段性成果(
yield
的值)给你。等你下次需要时,它再从上次停下的地方接着跑。这种“暂停-恢复”的机制,使得生成器能够保存其内部状态,这是普通函数做不到的。

至于为什么选择生成器而非列表,核心考量就是效率资源消耗

  1. 内存效率: 这是生成器最大的优势。列表(list)会一次性将所有元素加载到内存中。如果你的数据量非常大,比如一个GB级别的日志文件,或者一个理论上无限的数字序列,将它们全部存入列表会直接导致内存溢出。生成器则不然,它每次只在需要时生成一个元素,内存中只保存当前生成状态和少量数据,极大地降低了内存占用。
  2. 惰性计算(Lazy Evaluation): 生成器是惰性求值的典范。它只计算你真正需要的部分。比如,你可能只需要一个序列的前100个元素,即使这个序列可以无限长,生成器也只会计算到第100个就停止。而如果你用列表来表示,即使你只取前100个,也可能需要先计算出所有元素。这在处理大型数据集或网络流时尤其重要。
  3. 无限序列: 只有生成器才能优雅地表示无限序列,比如斐波那契数列、质数序列等。因为它们不需要一次性生成所有元素,而是按需提供。

所以,如果你的数据量可控,或者你需要频繁地随机访问列表中的元素,那么列表可能是更好的选择。但如果你的数据量巨大、需要进行流式处理,或者希望实现惰性计算,那么生成器无疑是更明智、更高效的选择。

如何理解
yield from
的用法及其优势?

yield from
是 Python 3.3 引入的一个语法糖,它主要是为了简化委托给子生成器的逻辑。初看可能有点迷惑,但一旦理解了它的应用场景,你会发现它让代码变得非常简洁和强大。

想象一下,你有一个复杂的生成器,它需要从多个不同的“源”生成数据。在

yield from
出现之前,你可能会写出这样的代码:

淄博分类信息港程序seo特别版
淄博分类信息港程序seo特别版

seo特别版程序介绍:注意:普通用户建议使用淄博分类信息港程序普通版本。主要针对seo需要增加了自定义功能:自定义文件路径;自定义文件名;自定义关键字。这些功能的作用,只有自己体会了。以下是淄博分类信息港程序的介绍:淄博分类信息港程序一套现成的城市分类信息网站发布系统。发布管理房屋、人才、招租、招聘、求购、求租、搬迁、运输、二手交易、招生培训、婚介交友等各类信息的发布和查询。淄博分类信息港发布程序

下载
def sub_generator_a():
    yield 'A1'
    yield 'A2'

def sub_generator_b():
    yield 'B1'
    yield 'B2'

def main_generator_old():
    for item in sub_generator_a():
        yield item
    for item in sub_generator_b():
        yield item

# 使用旧方法
for x in main_generator_old():
    print(x)
# 输出:A1 A2 B1 B2

这段代码虽然能工作,但

for item in ... yield item
这种模式写多了会显得有些冗余。
yield from
就是来解决这个问题的。它允许一个生成器直接将迭代的控制权委托给另一个迭代器(通常是另一个生成器)。

使用

yield from
后,代码会变得更简洁:

def sub_generator_a():
    yield 'A1'
    yield 'A2'

def sub_generator_b():
    yield 'B1'
    yield 'B2'

def main_generator_new():
    yield from sub_generator_a() # 委托给sub_generator_a
    yield from sub_generator_b() # 委托给sub_generator_b

# 使用新方法
for x in main_generator_new():
    print(x)
# 输出:A1 A2 B1 B2

这看起来只是简化了代码,但

yield from
的能力远不止于此。它不仅仅是语法糖,更重要的是,它能够透明地处理子生成器的所有通信,包括
send()
throw()
close()
方法。这意味着外部调用者可以直接与子生成器进行交互,而不需要主生成器做额外的转发处理。这在构建更复杂的协程(coroutines)和异步编程模式时,显得尤为重要,因为它允许数据和控制流在多层生成器之间无缝传递。

简而言之,

yield from
的优势在于:

  1. 代码更简洁: 避免了冗余的
    for item in ... yield item
    模式。
  2. 更强大的委托: 不仅传递
    yield
    的值,还能处理
    send()
    throw()
    等方法,使得子生成器能够接收外部输入或处理异常。
  3. 构建复杂生成器链: 使得多个生成器可以像乐高积木一样组合起来,形成一个更强大的数据处理管道。

生成器在实际开发中常见的应用场景有哪些?

生成器在实际开发中简直是无处不在,尤其是在需要处理大量数据或构建高效数据流的场景。我个人在很多项目中都依赖它来优化性能和内存。

  1. 处理大型文件: 这是最经典的场景之一。比如,你需要读取一个几十GB的日志文件或CSV文件。如果一次性

    readlines()
    ,内存肯定吃不消。使用生成器可以逐行读取,每次只在内存中保留一行数据进行处理。

    def read_large_file(filepath):
        with open(filepath, 'r', encoding='utf-8') as f:
            for line in f:
                yield line.strip()
    
    # 逐行处理文件,而不会一次性加载所有内容
    for log_entry in read_large_file('my_huge_log.txt'):
        if "ERROR" in log_entry:
            print(f"发现错误:{log_entry}")
  2. 数据流处理管道: 当你需要对数据进行一系列的转换、过滤操作时,生成器可以构建一个高效的“数据处理管道”。每个生成器负责一个步骤,将处理后的结果

    yield
    给下一个生成器。

    def filter_even(numbers):
        for n in numbers:
            if n % 2 == 0:
                yield n
    
    def square(numbers):
        for n in numbers:
            yield n * n
    
    # 构建管道:生成数字 -> 过滤偶数 -> 求平方
    nums = range(1, 11)
    processed_data = square(filter_even(nums)) # 惰性求值
    
    for res in processed_data:
        print(res) # 输出:4 16 36 64 100

    这种链式调用,每个步骤都是惰性的,只有在真正需要结果时才计算。

  3. 实现自定义迭代器: 如果你需要一个自定义的数据结构,或者希望以非传统方式遍历一个对象,生成器提供了一种非常简洁的方式来实现

    __iter__
    方法,让你的对象变得可迭代。

  4. 无限序列的生成: 像斐波那契数列、质数生成器等,它们本质上是无限的。生成器是唯一能在不耗尽内存的情况下表示和使用这些序列的方式。

    def fibonacci_sequence():
        a, b = 0, 1
        while True:
            yield a
            a, b = b, a + b
    
    fib_gen = fibonacci_sequence()
    for _ in range(10):
        print(next(fib_gen)) # 输出前10个斐波那契数
  5. 资源管理(配合

    contextlib.contextmanager
    ): 虽然不是直接使用
    yield
    ,但
    contextlib.contextmanager
    装饰器就是基于生成器实现的,它提供了一种简洁的方式来创建上下文管理器,确保资源的正确获取和释放(比如文件句柄、数据库连接等)。

这些场景都体现了生成器在提高代码效率、降低内存消耗和增强代码可读性方面的巨大价值。掌握了

yield
,你就掌握了 Python 中处理大规模数据和构建高效数据流的利器。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

716

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

627

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

743

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1236

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

699

2023.08.11

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

74

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 2.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号