五分钟理解Python元类(Metaclasses)

“元类的魔幻变化比 99% 的用户所担心的更多,当你搞不懂是否真的需要用它的时候,就是不需要。”—Tim Peters

本文源于在 PyCon UK 2008 上的一个快速演讲。

元类被称为 Python 中的“深奥的巫术”。尽管你需要用到它的地方极少(除非你基于 zope编程),可事实上它的基础理论其实令人惊讶地易懂。

 一切皆对象

◆ 一切皆对象

◆ 一切都有类型

◆ “class”和“type”之间本质上并无不同

◆ 类也是对象

◆ 它们的类型是 type

以前,术语 type 用于内置类型,而术语 class 用于用户定义的类,但自 Pythoon 2.2 以来“class”和“type”本质上并无不同。

对于旧风格(old-style)类的类型是 types.ClassType。

真的,这是真的

Python 2.5.1 (r251:54869, Apr 18 2007, 22:08:04)  



>>> class Something(object):  




...     pass 



...  


>>> Something  



<class '__main__.Something'>  



>>> type(Something)  



<type 'type'> 

从这里可以看出在交互式解释器中创建的类是一个 first class 的对象。

类的类是……

它的元类……

就像对象是类的实例一样,类是它的元类的实例。

调用元类可以创建类。

确切来说,Python 中的其它对象也是如此。

因此当你创建一个类时……

解释器会调用元类来生成它……

定义一个继承自 object 的普通类意味着调用 type 来创建它:

>>> help(type)  


 



Help on class type in module __builtin__:  



 


   


 



class type(object)  



 


 |  type(object) -> the object's type  


 


 |  type(name, bases, dict) -> a new type 

type 的第二种用法尤为重要。当 Python 解释器在执行一条类定义语句时(如例子中最初的两行代码之后),它会用下面的参数调用 type:

◆ 字符串形式的类名

◆ 元组形式的基类序列——在我们的例子中是只有一个元素的元组(’one-pl’)[1],如(object,)。

◆ 包括由名字影射的类成员(类属性、方法等)的字典

简单模拟

>>> def __init__(self):  



...     self.message = 'Hello World' 



...  



>>> def say_hello(self):  




...     print self.message  



...  



>>> attrs = {'__init__': __init__, 'say_hello': say_hello}  



>>> bases = (object,)  



>>> Hello = type('Hello', bases, attrs)  



>>> Hello  



<class '__main__.Hello'>  



>>> h = Hello()  


>>> h.say_hello()  


Hello World 

以上代码创建了类属性的字典,然后调用 type 来创建了名为 Hello 的类。

__metaclass__ 的魔法

只要在类定义中把 __metaclass__ 设置为任意有着与 type 相同参数的可调用对象,就能够提供自定义的元类。

通常使用从 type 继承的方法:

class PointlessMetaclass(type):  



    def __new__(meta, name, bases, attrs):  




        # do stuff...  




        return type.__new__(meta, name, bases, attrs) 

重要的是在 __new__ 方法中我们能够读取或改变传入的用以创建新类的参数。从而能够内省属性字典和改动、增加或者删除成员。

尽管当实例化一个类时这两个函数都会被调用,但覆盖 __new__ 比 __init__ 更为重要。__init__ 初始化一个实例,而 __new__ 的职责是创建它。因此如果元类用以自定义类的创建,就需要覆盖 type 的 __new__。

使用新类而非仅仅提供工厂函数的原因在于如果使用工厂函数(那样只是调用 type)的话元类不会被继承。

In Action...

>>> class WhizzBang(object):  


...     __metaclass__ = PointlessMetaclass  


...  


>>> WhizzBang  



<class '__main__.WhizzBang'>  



>>> type(WhizzBang)  



<class '__main__.PointlessMetaClass'> 

WhizzBang 是一个类,但它现在已经不是 type 的实例,而是我们自定义的元类的实例了……

这有什么用?

很好的问题,元类将用在创建使用了它的新类时调用,这里是一些关于这样做的好处的观点:

◆ 装饰(Decorate)类的所有方法,用以日志记录或者性能剖分。

◆ 自动 Mix-in 新方法

◆ 在创建时注册类。(例如自动注册插件或从类成员创建数据库模式。)

◆ 提供接口注册,功能自动发现和接口适配。

◆ 类校验:防止子类化,校验所有的方法是否都有 docstrings。

最重要之处在于元类中是在最后对 type 的调用时才真正创建类,所以可以自由地随你喜欢地改变属性字典(以及名称和元组形式的基类序列)。

一些流行的 Python ORM(Object Relational Mappers(对象关系影射),用以和数据库协同工作)也如此使用元类。

哦,还有因为元类是继承的,所以你能够提供一个使用了你的元类的基类,而继承自它的子类就无需显式声明它了。

但是……

我曾未需要使用它来编写代码……(我们用它来剖分,也在 Ironclad 项目广泛应用它,但我不编写这些)。

还有,这一切只适用于 Python 2.x,其中的机制在 Python 3 中已经改变了。

type(type) is type

在 Python 2.6 中现在也可用使用 class decorators 来实现许多以前可能需要用元类来实现的东西。

最后,还有一个极尽奇技淫巧的例子(稍为深入,但仍然不难消化),可以去看看 The Selfless Metaclass。它通过字节码和方法签名重写来避免显式地声明 self。

相关推荐