📜  Python迭代器

📅  最后修改于: 2020-09-19 14:45:02             🧑  作者: Mango

迭代器是可以迭代的对象。在本教程中,您将学习迭代器的工作原理以及如何使用__iter__和__next__方法构建自己的迭代器。

Python的迭代器

迭代器在Python中无处不在。它们在for循环,理解,生成器等中优雅地实现,但隐藏在清晰的视野中。

Python的 Iterator只是可以迭代的对象。一个将返回数据的对象,一次返回一个元素。

从技术上讲, Python 迭代器对象必须实现__iter__()__next__()两个特殊方法,统称为迭代器协议

如果我们可以从对象获得迭代器,则该对象称为迭代。 Python大多数内置容器(例如:列表,元组, 字符串等)都是可迭代的。

iter() 函数 (依次调用__iter__()方法)从它们返回一个迭代器。

通过迭代器进行迭代

我们使用next() 函数手动遍历迭代器的所有项目。当我们到达末尾并且没有更多数据要返回时,它将引发StopIteration Exception。以下是一个示例。

# define a list
my_list = [4, 7, 0, 3]

# get an iterator using iter()
my_iter = iter(my_list)

# iterate through it using next()

# Output: 4
print(next(my_iter))

# Output: 7
print(next(my_iter))

# next(obj) is same as obj.__next__()

# Output: 0
print(my_iter.__next__())

# Output: 3
print(my_iter.__next__())

# This will raise error, no items left
next(my_iter)

输出

4
7
0
3
Traceback (most recent call last):
  File "", line 24, in 
    next(my_iter)
StopIteration

自动迭代的一种更优雅的方法是使用for循环。使用此方法,我们可以迭代可以返回迭代器的任何对象,例如list, 字符串,file等。

>>> for element in my_list:
...     print(element)
...     
4
7
0
3

迭代器的for循环工作

如上例所示, for循环能够自动遍历列表。

实际上, for循环可以迭代任何可迭代的对象。让我们仔细看看for循环是如何在Python实际实现的。

for element in iterable:
    # do something with element

实际上是实现为。

# create an iterator object from that iterable
iter_obj = iter(iterable)

# infinite loop
while True:
    try:
        # get the next item
        element = next(iter_obj)
        # do something with element
    except StopIteration:
        # if StopIteration is raised, break from loop
        break

因此,在内部, for循环通过在iterable上调用iter()创建一个迭代器对象iter_obj

具有讽刺意味的是,这个for循环实际上是一个无限的while循环。

在循环内部,它调用next()获取下一个元素,并使用该值执行for循环的主体。在所有项目耗尽之后, StopIteration被提升,并在内部捕获并结束循环。请注意,任何其他类型的异常都将通过。

构建自定义迭代器

在Python从头开始构建迭代器很容易。我们只需要实现__iter__()__next__()方法即可。

__iter__()方法返回迭代器对象本身。如果需要,可以执行一些初始化。

__next__()方法必须返回序列中的下一项。在到达末尾以及随后的调用中,它必须引发StopIteration

在这里,我们显示一个示例,该示例将在每次迭代中为我们提供下一个2的幂。幂指数从零开始一直到用户设置的数字。

class PowTwo:
    """Class to implement an iterator
    of powers of two"""

    def __init__(self, max=0):
        self.max = max

    def __iter__(self):
        self.n = 0
        return self

    def __next__(self):
        if self.n <= self.max:
            result = 2 ** self.n
            self.n += 1
            return result
        else:
            raise StopIteration


# create an object
numbers = PowTwo(3)

# create an iterable from the object
i = iter(numbers)

# Using next to get to the next iterator element
print(next(i))
print(next(i))
print(next(i))
print(next(i))
print(next(i))

输出

1
2
4
8
Traceback (most recent call last):
  File "/home/bsoyuj/Desktop/Untitled-1.py", line 32, in 
    print(next(i))
  File "", line 18, in __next__
    raise StopIteration
StopIteration

我们还可以使用for循环来迭代迭代器类。

>>> for i in PowTwo(5):
...     print(i)
...     
1
2
4
8
16
32

Python无限迭代器

不必耗尽迭代器对象中的项目。可以有无限迭代器(永无止境)。处理此类迭代器时,我们必须小心。

这是一个演示无限迭代器的简单示例。

可以使用两个参数调用内置函数 iter() 函数 ,其中第一个参数必须是可调用的对象(函数),第二个参数是前哨。迭代器将调用此函数,直到返回的值等于哨兵。

>>> int()
0

>>> inf = iter(int,1)
>>> next(inf)
0
>>> next(inf)
0

我们可以看到int() 函数始终返回0。因此,将其作为iter(int,1)传递将返回一个迭代器,该迭代器调用int()直到返回值等于1。这永远不会发生,并且我们得到一个无限迭代器。

我们还可以构建自己的无限迭代器。理论上,以下迭代器将返回所有奇数。

class InfIter:
    """Infinite iterator to return all
        odd numbers"""

    def __iter__(self):
        self.num = 1
        return self

    def __next__(self):
        num = self.num
        self.num += 2
        return num

样本运行如下。

>>> a = iter(InfIter())
>>> next(a)
1
>>> next(a)
3
>>> next(a)
5
>>> next(a)
7

等等...

在这些类型的无限迭代器上进行迭代时,请小心包含终止条件。

使用迭代器的优点是节省了资源。如上所示,我们无需将整个数字系统存储在内存中就可以获得所有奇数。从理论上讲,我们可以在有限内存中包含无限项。

有一种在Python创建迭代器的简便方法。要了解更多信息,请访问:使用yield的Python生成器。