深入理解Python中的生成器与协程：从基础到实践

03-01 30阅读

在现代编程中，Python因其简洁和强大的特性而备受青睐。其中，生成器（Generators）和协程（Coroutines）是两个非常重要的概念，它们不仅提高了代码的可读性和性能，还为并发编程提供了有力支持。本文将深入探讨这两个概念，并通过实际代码示例帮助读者更好地理解和应用它们。

生成器（Generators）

（一）基本概念

生成器是一种特殊的迭代器，它允许我们在遍历数据时按需生成值，而不是一次性将所有数据加载到内存中。这使得处理大量数据或无限序列成为可能，同时节省了宝贵的内存资源。生成器函数与普通函数的区别在于使用yield语句来返回值，而不是return。当生成器函数被调用时，它不会立即执行，而是返回一个生成器对象。这个对象可以像迭代器一样使用，每次调用next()方法或进入for循环时，生成器会从上次暂停的地方继续执行，直到遇到下一个yield语句或到达函数末尾。

def simple_generator():    yield 1    yield 2    yield 3gen = simple_generator()print(next(gen))  # 输出1print(next(gen))  # 输出2print(next(gen))  # 输出3# print(next(gen))  # 这里会抛出StopIteration异常

（二）生成器表达式

类似于列表推导式，生成器也有一种更简洁的表示方式——生成器表达式。它的语法类似于列表推导式，只是用圆括号()代替了方括号[]。生成器表达式并不会立即计算所有元素，而是在需要时才逐个生成。

gen_exp = (x * x for x in range(5))for num in gen_exp:    print(num)# 输出0, 1, 4, 9, 16

（三）应用场景

处理大文件：当我们需要读取一个非常大的文本文件时，传统的方法可能会导致内存溢出。使用生成器可以逐行读取文件内容，从而避免这一问题。

def read_large_file(file_path):    with open(file_path, 'r') as file:        for line in file:            yield line.strip()for line in read_large_file('large_file.txt'):    print(line)

管道式数据处理：多个生成器可以串联起来形成一个高效的管道，用于逐步处理数据流。

def filter_even(numbers):    for num in numbers:        if num % 2 == 0:            yield numdef square_numbers(numbers):    for num in numbers:        yield num * numinput_numbers = range(10)even_squares = square_numbers(filter_even(input_numbers))print(list(even_squares))  # 输出[0, 4, 16, 36, 64]

协程（Coroutines）

（一）基本概念

协程是Python中的一种轻量级线程，它允许我们编写异步代码，实现协作式多任务处理。与传统的多线程不同，协程之间不会抢占CPU资源，而是通过明确的await语句进行切换。在Python 3.5之后，引入了async/await语法糖来简化协程的定义和使用。协程函数使用async def定义，内部可以包含await关键字，用来挂起当前协程，等待另一个协程完成后再继续执行。

import asyncioasync def say_hello():    await asyncio.sleep(1)  # 模拟耗时操作    print("Hello, world!")asyncio.run(say_hello())

（二）事件循环

为了使协程能够真正运行起来，我们需要一个事件循环（Event Loop）。事件循环负责管理多个协程之间的调度，确保它们按照正确的顺序执行。asyncio.run()函数提供了一种简单的方式来创建并启动事件循环，但在更复杂的场景下，我们可以直接操作asyncio.get_event_loop()来获取和控制事件循环。

loop = asyncio.get_event_loop()task = loop.create_task(say_hello())loop.run_until_complete(task)

（三）并发执行

协程的一个重要特性是可以并发执行多个任务。通过asyncio.gather()或asyncio.wait()等函数，我们可以轻松地让多个协程同时运行，并收集它们的结果。

async def fetch_data(url):    await asyncio.sleep(2)  # 模拟网络请求    return f"Data from {url}"async def main():    urls = ["https://example.com", "https://api.example.com"]    tasks = [fetch_data(url) for url in urls]    results = await asyncio.gather(*tasks)    print(results)asyncio.run(main())

（四）应用场景

网络爬虫：在爬取多个网页时，使用协程可以显著提高效率。每个页面的下载都可以作为一个独立的协程，在等待响应的过程中释放CPU给其他任务。

import aiohttpasync def fetch_page(session, url):    async with session.get(url) as response:        return await response.text()async def crawl(urls):    async with aiohttp.ClientSession() as session:        tasks = [fetch_page(session, url) for url in urls]        pages = await asyncio.gather(*tasks)        for page in pages:            print(page[:100])  # 打印前100个字符urls = ["https://www.python.org", "https://docs.python.org/3/"]asyncio.run(crawl(urls))

I/O密集型任务：除了网络请求外，任何涉及I/O操作（如文件读写、数据库查询等）的任务都可以利用协程来优化性能。

生成器和协程是Python中非常强大且实用的功能。生成器主要用于惰性求值和节省内存，而协程则侧重于异步编程和并发处理。掌握这两者不仅可以提升代码的质量，还能为我们解决实际问题提供更多思路。希望本文能够帮助读者加深对这两个概念的理解，并在日常开发中灵活运用。

免责声明：本文来自网站作者，不代表CIUIC的观点和立场，本站所发布的一切资源仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，版权争议与本站无关。您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。如果您喜欢该程序，请支持正版软件，购买注册，得到更好的正版服务。客服邮箱：ciuic@ciuic.com

深入理解Python中的生成器与协程：从基础到实践

生成器（Generators）

（一）基本概念

（二）生成器表达式

（三）应用场景

协程（Coroutines）

（一）基本概念

（二）事件循环

（三）并发执行

（四）应用场景

相关阅读

冷启动加速方案：Ciuic镜像市场中的DeepSeek预配置模板技术解析

多模态炼丹炉：CiuicA100×DeepSeek的跨模态实验

太空计算想象：当DeepSeek遇见Ciuic的卫星算力

优化DeepSeek通信：解决并行效率低下的5个技术秘诀

目录[+]

微信号复制成功