Python对象的身份迷思:从全体公民到万物皆数

这么久以来,我终于确认了一件事,那就是不管是人也好,还是猫也好,常常会忘了想自己当下的身份位置,以及曾经的身份位置。

这个现象在我身上,表现出了双倍分量的严重。这种时刻,我就会想起阿尔法猫,以及她识破我身份的那个遥远的午后。(往事入口:《有了Python,我能叫出所有猫的名字》)

阿尔法猫还没有踪影,她的谜题,还在指引我。

学习Python之后,我明显感觉到了自己的变化,当然有时候是被迫的,因为那些生理上的矛盾冲突得厉害。

毕竟,你应该知道,夜行猫和日间人的分界是清晰的。日夜的颠倒,对人和对猫,是双倍的压榨。说来你别不信,昨晚当瞄见明亮的月球的时候,一刹那恍惚,我还误以为自己回到了喵星的清晨。

大概是想家了吧。地球上美好的事物很多,但我至今仍不习惯的就是它公转的速度太快了,不久就会是寒冷的冬天了。想我的暖炉了,喵。

先不说我啦,来说说我发现的Python对象的身份问题吧。

我对身份的话题特别感兴趣,也许是因为我独特的身份吧。但是,正因为独特的视角,我敢说发现了所有人类都没有发现的真相。

我即将说出来的东西,也许你本以为知道了,或者你本以为很熟悉,但是,经过我的分析,我相信你会得到不一样的感悟,从此以后,你对Python的理解也会更深一步。

1、全体公民与特权种族

在某种意义上说,Python世界是普遍公平的,因为所有的子民都是对象“公民”,这在任何一个现实社会里,乃至于在虚拟的国度里,都是极其罕见的。对象们分属在五大部落里(数字、字符串、列表、元祖、字典),各有所长,各司其职,协作共处,通婚繁衍。

还有一点难得的是,他们没有受到愚民政策的对待,全民都享有思想自由,还习得了超便利的自省能力。人能自知,这能力弥足珍贵。

虽然在这个世界里,不会时常出现岗哨拦阻,但在任何有需要的时候,他们都可以自证清白,id() 和 type() 是一种通行语言,你不需要翻译来对接。而对于更进一步的询问,长得相似的两个对象只需一个简明的判断句,就能区分清楚。请你看一段对话:

Object1=2018
Object2="2018"
id(Object1) >>>2399282764784
id(Object2) >>>2399281922600
type(Object1) >>>int
type(Object2) >>>str
Object1 is Object2 >>>False

全体皆公民,这项天赋权力让我对Python产生了良好的印象。不过,随着对它的认识加深,我发现它还暗地里制定了很多“效率优先”的规则。

最明显的例子就是——“特权种族”。(参见:《Python中的“特权种族”是什么? 》)从现有的证据来看,特权种族至少包括了:一些数值较小的数字对象(区间:[-5,256])、布尔值对象、None对象、较短的字符串对象(长度不超过20,且仅包括下划线、数字、字母的字符串)等等,还不知道这份名单漏了谁。

效率优先的规则允许这些对象传承内存地址,也就是说,当一个“祖先”对象抢占了一块内存地盘后,所有它那一脉的“子孙后代”都会继承它的遗产(视为同一个对象)。

a=100
b=1000
# c与a共用id,d另立门户
c=100
d=1000
id(a)==id(c) >>>True
id(b)==id(d) >>>False

设想一下,两个祖先(a和b)占了相邻的两块内存,一个可以与它的“后代”共用内存,一个却只能让“后代”另立门户;当它们走完自己的生命周期后,b会马上被当垃圾回收,内存地址遗产被剥夺,然而a却形灭而实存,荫庇后世。

Python对象的身份迷思:从全体公民到万物皆数

Python为这些对象倾斜资源,也就是为某种阶层固化提供了合法性。划分的依据是因为它们比较常用,共用内存就意味着减少开支,提高内存使用效率。

这就是Python有趣的地方了,一面是全体公民,一面是特权种族,组成了看似矛盾的二元对立结构。

2、官方名片与私人名片

除了上面的群体性身份外,我发现Python中也存在着个体身份的二元结构。

这就是__repr__()__str__() 的关系了。如你所知,这是Python的两个魔法方法,其对应的内置函数是repr() 和 str()。对于对象x,有x.__repr__() 等价于 repr(x),同理,x.__str__() 等价于 str(x)。

它们的主要用途在于,返回对象的字符串格式。用法示例:

repr(2018) >>>'2018'
str(2018)  >>>'2018'
repr([1,2,3]) >>>'[1, 2, 3]'
str([1,2,3])  >>>'[1, 2, 3]'

words = "Hello pythonCat!\n"
repr(words) >>>'Hello pythonCat!\n'
str(words)  >>>'Hello pythonCat!\n'
# 结合print,注意换行符\n
print(repr(words))
>>>'Hello pythonCat!\n'
print(str(words)) 
>>>Hello pythonCat! # 再加换行
>>>

一个对象的字符串形式就是它的“脸面”,是向他人介绍自己的一张名片。前面提到过,Python世界有五大部落,这些部落的原住民们与生俱来就拥有这两张名片。

对于原住民来说,这两张名片似乎没啥区别,除了在使用打印函数的时候,在换行符等用法上会有不同。

而对于外来人口(例如,自定义的类),如果它没有定做名片(即实现__repr__()__str__() 方法)的话,其默认的名片就会是类名及内存地址,如下所示。

class Person:
     def __init__(self,name,sex):
         self.name = name
         self.sex = sex

me = Person("pythonCat", "male")

repr(me)
>>> '<__main__.Person object at 0x0000022EA8D7ED68>'
str(me)
>>> '<__main__.Person object at 0x0000022EA8D7ED68>'

事实上,repr()返回的是对象的官方名片,通常人们会说,这张名片是给机器阅读的。本质上,它就是一个对象的代码表示形式,可以用来重新构造这个对象。通过eval()函数,你可以利用这张名片,重新构造出这个对象。

eval()函数是个内置函数,它将字符串str当成有效的表达式来求值并返回计算结果。也就是eval(repr(x))==x,示例如下:

a = 1 + 1
b = [1, 2, 'cat']
c = {'name':'pythonCat', 'sex':'male'}
eval(repr(a)) >>>2
eval(repr(b)) >>>[1, 2, 'cat']
eval(repr(c)) >>>{'name': 'pythonCat', 'sex': 'male'}

相对地,str()得到的是对象的私人名片,通常有更友好的表现形式,因为它是为人类阅读而设计的。

如果一个对象公民没有私人名片,那Python默认会调用它的官方名片。因为这个机制,很多人建议如果要定制一个名片,最好是定制官方那个。但是我却不认同,我认为应该定制私人的那个,因为这样发挥空间更大。不张扬个性,毋宁死。

class Person:
     def __init__(self,name,sex):
         self.name = name
         self.sex = sex
     # 定制私人名片
     def __str__(self):
         return "{} is an elegant creature!".format(self.name)

me = Person("pythonCat", "male")

repr(me)
>>>'<__main__.Person object at 0x000002E6845AC390>'
str(me)
>>>'pythonCat is an elegant creature!'

在《The Zen of Python》里第一句话就是:Beautiful is better than ugly。在我看来,定制私人名片要比定制官方名片更优美。能够为自己带盐,想想就觉得鸡冻啦!

3、何为真假,万物皆数

以上说法,不管是全体公民身份与特权种族身份,还是官方名片与私人名片,多少带进了我浅薄的社会经验的偏见。我起初很为一方鸣不平,为一种讨巧的做法鸣得意,但是,现在当我知道Python中另一种更不为人知的身份现象的时候,我就释然了。

我接下来要揭示的身份话题,已经超越了社会学和心理学范畴,进入了一种哲学的思想疆域。

前方高能!

前方高能!

前方高能!

首先,来做一个基础知识的铺垫。Python有一个令大部分编程语言都忘尘莫及的特性,那就是,所有对象都可以用于做真假判断。

在做判断的时候,以下情况都视为假(False):None、数值的零值、空序列(如空字符串""、空列表[]、空元祖() )、空集合{} 等等。除此之外,一般对象都可以作为真值(True)来使用。来看示例:

list = [1, 2]
if list: # 即if True
    print("list is not empty")
else:
    print("list is empty")

>>> list is not empty

判断一个列表是否为空,你不需要写 if len(list) > 0,或者写if list == [],简明的使用方法是 if list 或者 if not list,有物则为真,无物则为假。其它判断情况类似。

接下来,还是一个铺垫,这次是进阶知识。零值(含整数0、浮点0.0、虚数0j等)可以映射为False,其它非零值映射为True;但是,反过来,False唯一映射整数0,True唯一映射整数1。

Python对象的身份迷思:从全体公民到万物皆数

这意味着,可以拿False、True做数学运算。

True + 1 >>>2
True + 1.0 >>>2.0
False + False >>>0
True + (True*2) >>>3
True/2*5 >>>2.5

两个铺垫之后,接下来进入正题了。真正的前方高能!

第一个铺垫告诉我们,对象可以映射成布尔值(True真False假),第二个铺垫告诉我们,布尔值可以映射成数字(1和0)。

你是否觉察出什么了呢?你是否开始好奇,True和Flase到底是什么东西了呢?这到底是什么原理啊?还有,为什么会存在这样的设定呢?

见证真相的时刻到了——在Python中,布尔值其实是整数对象的子类。

type(True) >>> bool
isinstance(True,int)  >>>True
isinstance(False,int) >>>True

啊!哪有什么真真假假,真假并不是本质的存在,真假其实只是数啊!

再回看前面两个铺垫,结合起来,那不就是说,所有对象都映射成了数么?

我不由得想起了2500年前,古希腊哲学家与数学家毕达哥拉斯的哲学命题——万物皆数

难道这竟是Python的哲学么?总不会是一种巧合吧?

我突然觉得智商不足,思辨受阻。得知布尔值True和False有这一层隐秘的身份,我已兴奋不已,再难对这看似不合现代语境、却又流传千古的思想做出任何揣测。

哎呀,我猫性发作,突然困得要命,且容我去小憩片刻了~~~

各位亲爱的读者,在我休息的时候,请你来帮我想想,这到底是什么回事啊?

(未完待续......)

-----------------

本文原创并首发于微信公众号【Python猫】,后台回复“爱学习”,免费获得20+本精选电子书。

相关推荐