网上许多文章说Python的for语句中,in关键字后面的对象是一个集合。例如
for i in [1,2,3] PRint i上面代码中in关键字后面的对象[1,2,3]是一个list,也是一个集合。但in关键字后面的对象其实不必是一个集合。后面接一个序列对象也是合法的。 例如
myrange = MyRange(0, 10)for i in myrange: print i上面代码中的myrange对象是一个序列对象,但不是集合。参见上一篇博文。事实上,for语句中in关键字后面的对象也不必是序列对象,它只需要是一个可迭代对象(Iterable)即可。
一个可迭代的对象需要满足下面两个条件之一:
它实现了__iter__方法。该方法会返回一个迭代器对象。或者它是一个序列对象。注意:如果一个类型实现了__iter__方法,那么在该方法中显式地给出了与该类型相关的迭代器如何构造。可是,对于序列类型来说,它有一个很天然的迭代器。因此,无需通过实现__iter__方法来显式定义。下一篇博文将介绍如何通过序列对象构造天然的迭代器。这里先介绍迭代器对象的严格定义。
一个迭代器,本质上也是一个序列。它需要实现下面两个方法。
next方法(老版本的Python叫__next__方法)。当第11次调用next方法时,会返回序列的第1个元素;当第2次调用next方法时,会返回序列的第2个元素;当序列中的元素耗尽,抛出StopIteration异常。__iter__方法。前面说过__iter__方法通常返回迭代器对象。因此,对于一个迭代器来说,它的__iter__方法只需返回其本身即可。通过上面的定义,我们知道,一个迭代器对象,也必是可迭代的。
下面的代码定义了一个迭代器。
class MyIterator: def __init__(self, start, end): self.start = start self.end = end def next(self): if self.start >= self.end: raise StopIteration self.start = self.start + 1 return self.start - 1 def __iter__(self): return self测试代码myiter = MyIterator(0, 2)print myiter.next()print myiter.next()print myiter.next()输出结果如下01Traceback (most recent call last): File "test.py", line 27, in <module> print myiter.next() File "test.py", line 16, in next raise StopIterationStopIteration下面的代码测试在for语句中使用迭代器
myiter = MyIterator(0, 10)for i in myiter: print i输出结果0123456789在下一篇博文中,将继续介绍for语句的工作原理。
新闻热点
疑难解答