10.2 与旧的类兼容
序列类型的构造方法最好接受可迭代的对象为参数,因为所有内置的序列类型都是这样做的。
reprlib
能够为某些对象生成长度有限的表示形式:
1 | In [1]: import reprlib |
注意,在 Python2 中,reprlib
模块的名字是 repr
。
调用
repr()
函数的目的是调试,因此绝对不能抛出异常。如果__repr__
方法的实现有问题,那么必须处理,尽量输出有用的内容,让用户能够识别目标对象。
10.3 协议和鸭子类型
在面向对象编程中,协议是非正式的接口,只在文档中定义,在代码中不定义。例如,Python 的序列协议只需要 __len__
和 __getitem__
两 方法。任何类(如 Spam
),只要使用标准的签名和语义实现了这两个方法,就能用在任何期待序列的地方。Spam
是不是哪个类的子类无关紧要,只要提供了所需的方法即可。
因此,Spam 的行为就像是一个序列,人们称其为鸭子类型(duck typing)。
协议是非正式的,没有强制力,因此如果你知道类的具体使用场景,通常只需要实现一个协议的部分。例如,为了支持迭代,只需实现 __getitem__
方法,没必要提供 __len__
方法。
协议可以视为鸭子类型语言使用的非正式接口。
10.4 可切片的序列
10.4.1 切片原理
1 | In [5]: class MySeq: |
这些步骤需要重点说明:
- 9:从 1 开始,到 4 结束,步幅为 2。
- 10:如果 [] 中有逗号,那么
__getitem__
收到的是元组。 - 11:元组中可以包含多个切片对象。
这里值得一提的是,slice
内置了 indices
方法,该方法开放了内置序列实现的棘手逻辑,用于优雅地处理缺失索引和负数索引,以及长度超过目标序列的切片:
1 | S.indices(len) -> (start, stop, stride) |
给定长度为 len
的序列,计算 S
表示的扩展切片的起始(start)和结尾(stop),以及步幅(stride)。超出边界的索引会被截掉,这与常规切片的处理方式相同。我们来看看这个方法的实际效果:
1 | In [12]: slice(None, 10, 2).indices(5) |
10.4.2 能处理切片的 __getitem__
方法
下面展示了一个将 __getitem__
委托给内部序列的实现:
1 | def __getitem__(self, index): |
这里需要说明这些细节:
- 1:对于切片操作,返回自身类型的实例而不是内部序列的切片。
- 2:测试
index
是否是整数时用的是numbers.Integral
,这是一个抽象基类。在isinstance
中使用抽象基类做测试能让 API 更灵活且更容易更新。
10.5 动态存取属性
属性查找失败后,解释器会调用 __getattr__
方法。简单来说,对 my_obj.x
表达式,Python 会检查 my_obj
实例有没有名为 x
的属性;如果没有,到类(my_obj.__class__
)中查找;如果还没有,顺着继承树继续查找。如果依旧找不到,调用 my_obj
所属类中定义的 __getattr__
方法,传入 self
和属性名称的字符串形式(如 'x'
)。
10.6 散列和快速等值
如果要快速比较两个序列是否相同,可以使用 zip
函数来实现:
1 | def __eq__(self, other): |