• 一文了解 Python 迭代器介绍及其作用


    迭代器:初探

    Python 学习的人都知道,Python 中存在两种循环语句:while 和 for。for 循环可以用于 Python 中的任何序列,包括列表、元组、字符串。

    1. >>> for x in [2013, 14, 15926]: print(x, end=' ')
    2. ...
    3. 2013 14 15926
    4. >>>
    5. >>> for x in (2021, 2022, 2023): print(x, end='->')
    6. ...
    7. 2021->2022->2023->
    8. >>> for x in 'HelloWorld': print(x, end=' ')
    9. ...
    10. H e l l o W o r l d

    实际上,for 循环还能使用于​任何可迭代对象​。可迭代对象在 Python 中是新颖特别的概念,但实际上就是序列概念的通用化:如果对象时实际保存的序列,或者可以在迭代工具中(如 for 循环)一次产生一个结果的对象,就看做可迭代的。可以说,Python 中迭代器无处不在

    什么是迭代器?

    Python 中的迭代器是一个对象,用于迭代列表、元组、字典和集合等可迭代对象。Python 迭代器对象必须实现两个特殊的方法:​​__iter__()​​​和​​__next__()​​ 方法:

    • 使用 ​​__iter__() ​​方法初始化迭代器对象

    • 使用 ​​__next__() ​​ 方法进行迭代。

    通过迭代器进行迭代

    ​iter()​​​ 函数依次调用 ​​__iter__()​​ 方法,返回一个迭代器。我们使用 ​​next() ​​​ 函数手动遍历迭代器的所有项。

    当我们到达终点并且没有更多数据要返回时,它将引发 ​​StopIteration​​ 异常。下面是一个例子:

    1. # define a list
    2. my_list = [2013, 14, 15926]
    3. # get an iterator using iter()
    4. my_iter = iter(my_list)
    5. # iterate through it using next()
    6. # Output: 2013
    7. print(next(my_iter))
    8. # Output: 14
    9. print(next(my_iter))
    10. # next(obj) is same as obj.__next__()
    11. # Output: 15926
    12. print(my_iter.__next__())
    13. # This will raise error, no items left
    14. next(my_iter)

    依次执行上面的代码,输出如下:

    1. 2013
    2. 14
    3. 15926
    4. Traceback (most recent call last):
    5. File "", line 24, in <module>
    6. next(my_iter)
    7. StopIteration

    一种更优雅的自动迭代方式是使用 for 循环。使用它,我们可以迭代任何可以返回迭代器的对象,例如列表、字符串、文件等。

    1. >>> for element in my_list:
    2. ... print(element)
    3. ...
    4. 2013
    5. 14
    6. 15926

    迭代器 for 循环的工作

    正如我们在上面的示例中看到的,for 循环能够自动遍历列表

    实际上 for 循环可以迭代任何可迭代对象。让我们仔细看看 for 循环是如何在 Python 中实际实现的。

    1. for element in iterable:
    2. # do something with element

    实际实现为:

    1. # create an iterator object from that iterable
    2. iter_obj = iter(iterable)
    3. # infinite loop
    4. while True:
    5. try:
    6. # get the next item
    7. element = next(iter_obj)
    8. print(element)
    9. # do something with element
    10. except StopIteration:
    11. # if StopIteration is raised, break from loop
    12. break

    所以在内部,for 循环通过在可迭代对象上调用 ​​iter()​​​ 创建一个迭代器对象 ​​iter_obj​​。具有讽刺意味的是,这个 for 循环实际上是一个无限的 while 循环。

    在循环内部,它调用 ​​next()​​​ 来获取下一个元素并使用该值执行 for 循环的主体。在所有项目耗尽后,​​StopIteration​​ 被引发,内部捕获并结束循环。请注意,任何其他类型的异常都会通过。

    构建自定义迭代器

    在 Python 中从头开始构建迭代器很容易。我们只需要实现 ​​__iter__() ​​​和 ​​__next__() ​​方法。

    ​__iter__() ​​方法返回迭代器对象本身。如果需要,可以执行一些初始化。

    ​__next__() ​​​方法必须返回序列中的下一项。在到达终点时以及在随后的调用中,它必须引发 ​​StopIteration​​。

    1. class PowTwo:
    2. """Class to implement an iterator
    3. of powers of two"""
    4. def __init__(self, max=0):
    5. self.max = max
    6. def __iter__(self):
    7. self.n = 0
    8. return self
    9. def __next__(self):
    10. if self.n <= self.max:
    11. result = 2 ** self.n
    12. self.n += 1
    13. return result
    14. else:
    15. raise StopIteration
    16. # create an object
    17. numbers = PowTwo(3)
    18. # create an iterable from the object
    19. i = iter(numbers)
    20. # Using next to get to the next iterator element
    21. print(next(i))
    22. print(next(i))
    23. print(next(i))
    24. print(next(i))
    25. print(next(i))

    输出结果:

    1. 1
    2. 2
    3. 4
    4. 8
    5. Traceback (most recent call last):
    6. File "/Users/yuzhou_1su/go/src/iterdemo.py", line 32, in <module>
    7. print(next(i))
    8. StopIteration

    我们还可以使用 for 循环来迭代我们的迭代器类。

    1. >>> for i in PowTwo(5):
    2. ... print(i)
    3. ...
    4. 1
    5. 2
    6. 4
    7. 8
    8. 16
    9. 32

    Python 无限迭代器

    迭代器对象中的项目不必耗尽。可以有无限的迭代器(永远不会结束)。在处理此类迭代器时,我们必须小心。

    这是一个演示无限迭代器的简单示例。

    内置函数 ​​iter()​​ 可以使用两个参数调用,其中第一个参数必须是可调用对象(函数),第二个参数是哨兵。迭代器调用这个函数,直到返回的值等于哨兵。

    1. >>> int()
    2. 0
    3. >>> inf = iter(int,1)
    4. >>> next(inf)
    5. 0
    6. >>> next(inf)
    7. 0

    我们可以看到 ​​int()​​​ 函数总是返回 0。因此将它作为 ​​iter(int,1)​​​ 传递将返回一个迭代器,该迭代器调用 ​​int()​​ 直到返回值等于 1。这永远不会发生,我们得到一个无限迭代器。

    我们还可以构建自己的无限迭代器。理论上,以下迭代器将返回所有奇数:

    1. class InfIter:
    2. """Infinite iterator to return all
    3. odd numbers"""
    4. def __iter__(self):
    5. self.num = 1
    6. return self
    7. def __next__(self):
    8. num = self.num
    9. self.num += 2
    10. return num
    '
    运行

    1. >>> a = iter(InfIter())
    2. >>> next(a)
    3. 1
    4. >>> next(a)
    5. 3
    6. >>> next(a)
    7. 5
    8. >>> next(a)
    9. 7

    在对这些类型的无限迭代器进行迭代时,请小心包含终止条件。如上所示,我们可以得到所有奇数,而无需将整个数字系统存储在内存中。理论上,我们可以在有限的内存中拥有无限的项目。

    Python 迭代器的好处

    使用迭代器的好处是可以节省资源。

    • 代码减少。

    • 代码冗余得到极大解决。

    • 降低代码复杂度。

    • 它为编码带来了更多的稳定性。

    总结

    Python 的迭代器提供稳定和灵活的代码。迭代器和可迭代对象的区别:

    • Iterable​ 是一个可以迭代的对象。它在传递给 ​​iter()​​ 方法时生成一个迭代器。

    • Iterator​ 是一个对象,用于使用 ​​__next__()​​​ 方法对可迭代对象进行迭代。迭代器有 ​​__next__() ​​方法,它返回对象的下一项。

    请注意,每个迭代器也是一个可迭代的,但不是每个可迭代的都是一个迭代器。

    例如,列表是可迭代的,但列表不是迭代器。可以使用函数 ​​iter() ​​从可迭代对象创建迭代器。

    为了实现这一点,对象的类需要一个方法 ​​__iter__​​​,它返回一个迭代器,或者一个具有从 0 开始的顺序索引的 ​​__getitem__​​​ 方法。但其本质也是实现了 ​​__iter__​​ 方法。

    参考资料:

  • 相关阅读:
    LLVM系列(1)- LLVM简介
    java 转换excel日期格式
    LeetCode-组合总和(C++)
    C++&QT day11
    一文带你了解电感的5大损耗
    答辩提纲的写作内容指导
    目标检测网络系列——YOLO V4
    用几分钟时间了解何为优质低代码开发平台
    【FastAPI】实现服务器向客户端发送SSE(Server-Sent Events)广播
    显示杂谈(一)Window以及WindowManager
  • 原文地址:https://blog.csdn.net/yuzhou_1shu/article/details/127069711