基于 Python 的数据模型,自定义类型可以实现和内置类型一样自然的行为,实际上靠的是 鸭子类型。
鸭子类型:按照预定行为实现对象所需的方法
0、最初的Vector类
from math import hypot # 两个数平方和开方
class Vector():
def __init__(self, x=0, y=0):
self.x = x
self.y = y
def __repr__(self): # 字符串表示形式
return 'Vector(%r, %r)' % (self.x, self.y)
def __abs__(self):
return hypot(self.x, self.y)
def __bool__(self):
return bool(abs(self))
# OR return bool(self.x or self.y)
def __add__(self, other):
return Vector(self.x + other.x, self.y + other.y)
def __mul__(self, scalar):
return Vector(self.x * scalar, self.y * scalar)
1、对象表现形式
Python 提供了两种获取对象的字符串表现形式的标准方式:
repr()
:便于开发者理解的方式返回对象字符串表现形式,由__repr__
特殊方法提供支持
str()
:便于用户理解的方式返回对象字符串表现形式,由__str__
特殊方法提供支持
为了给对象提供其他的表现形式,还涉及到另外两个特殊方法:
__bytes__
:与__str__
类似;bytes()
调用它获取对象的 字节序列表现形式
__format__
:被内置的format()
函数和str.format()
方法调用,使用特殊的格式代码显示对象的字符串表现形式
! PS:
Python3 中,
__repr__
、__str__
、__format__
都必须返回 Unicode 字符串 (str
类型);__bytes__
返回 字节序列 (bytes
类型)
2、Vector v0
from array import array
import math
class Vector2d:
typecode = 'd'
# 尽早转换为float,尽早捕获错误,防止传入非法参数
def __init__(self, x, y):
self.x = float(x)
self.y = float(y)
# 实现可迭代,用于拆包
def __iter__(self):
return (i for i in (self.x, self.y)) # OR yield self.x; yield self.y
# !r 获取各个分量的表现形式
def __repr__(self):
class_name = type(self).__name__ # OR self.__class__.__name__
return '{}({!r}, {!r})'.format(class_name, *self)
# 因为可迭代,可以根据实例得到元组
def __str__(self):
return str(tuple(self))
def __bytes__(self):
return bytes([ord(self.typecode)]) + bytes(array(self.typecode, self)) # 可迭代,可以根据实例得到数组
def __eq__(self, other):
return tuple(self) == tuple(other)
def __abs__(self):
return math.hypot(*self)
def __bool__(self):
return bool(abs(self))
@classmethod # 定义类方法:从字节序列转换成该类的实例
def frombytes(cls, octets):
typecode = chr(octets[0])
memv = memoryview(octets[1:]).cast(typecode) # 传入 octets 字节序列创建一个内存视图,使用 typecode 转换
return cls(*memv) # 拆包内存视图得到一对参数传入构造方法
v1 = Vector2d(3, 4)
# 无需调用读值方法,直接通过属性访问 Vertor 实例的分量
print(v1.x, v1.y)
# Out
3.0 4.0
# 因为可迭代,可以拆包成变量元组
x, y = v1
x, y
# Out
(3.0, 4.0)
# repr 字符串表现形式
v1
# Out
Vector2d(3.0, 4.0)
# 使用 eval 表明 repr 函数调用实例得到的是对构造方法的准确表述
v1_clone = eval(repr(v1))
v1 == v1_clone
# Out
True
# str 字符串表现形式
print(v1)
# Out
(3.0, 4.0)
# 二进制表现形式
bytes(v1)
# Out
b'd\x00\x00\x00\x00\x00\x00\x08@\x00\x00\x00\x00\x00\x00\x10@'
# Vertor模值
abs(v1)
# Out
5.0
# 布尔值
bool(v1), bool(Vector2d(0, 0))
# Out
(True, False)
# 字节序列转换成实例
v2 = Vector2d.frombytes(bytes(v1))
v2
# Out
Vector2d(3.0, 4.0)
3、classmethod
和 staticmethod
两者都是装饰器
classmethod
:定义操作类的方法(类方法),而不是操作实例;类方法的第一个参数是类本身;最常见的用途是定义备选构造方法(Vector v0 中的frombytes
方法)
staticmethod
:静态方法,其实就是普通函数,只不过在类的定义体中定义,而不在模块层定义
class Demo:
@classmethod
def klassmeth(*args):
return args
@staticmethod
def statmeth(*args):
return args
# 类方法的第一个参数始终是类本身
Demo.klassmeth(), Demo.klassmeth('spam')
# Out
((__main__.Demo,), (__main__.Demo, 'spam'))
# 静态方法的行为和普通函数相似
Demo.statmeth(), Demo.statmeth('spam')
# Out
((), ('spam',))
4、格式化显示
- 内置的
format()
函数和str.format()
方法把各个类型的格式化方式委托给相应的__format__(format_spec)
方法。 -
format_spec
—— 格式说明符,使用格式规范微语言(Format Specification Mini-Language)表示法:
format(obj, format_spec)
的第二个参数
str.format()
方法的格式字符串中,{}
里冒号之后的部分
它和 % 格式化方法 % 后面的部分基本一样,但是有所不同(如对齐方式)
详细的格式化符号及用法见 官方文档 和 fat39 的博客
brl = 1 / 2.43
brl
# Out
0.4115226337448559
format(brl, '0.4f') # 0可以省略
# Out
'0.4115'
'1 BRL = {rate:^15.2e} USD'.format(rate=brl)
# Out
'1 BRL = 4.12e-01 USD'
上例中的 0.4f
和 ^15.2e
(取小数点后两位,科学计数法表示,居中并占15个位置单位)就是 format_spec
类似于
{0.attr:5.3e}
这样的格式字符串包括两个部分:
- 冒号前的是 字段名,可以是数字表示,也可以是有具体含义的名称,如果它是某个类的实例并且要使用它的某个属性,可以使用
.
来获取- 冒号后的就是 格式说明符 (
format_spec
)
4 种十进制转十六进制的写法
# 1. hex 内置函数
hex(100)
# Out
'0x64'
# 2. % 格式化
'%x' % 100
# Out
'64'
# 3. format 函数
format(100, 'x')
# Out
'64'
# 4. str.format() 方法
'{:x}'.format(100)
# Out
'64'
二进制、八进制、十进制、十六进制 之间都可以用上述类似的方法相互转换。格式规范微语言为这些内置类型提供了专用的表示代码(如十六进制的 x)
格式规范微语言是可扩展的,每个类可以自行决定如何解释
format_spec
参数
如datetime
模块中的类,它们的__format__
方法使用的格式代码和strftime()
函数一样
from datetime import datetime
now = datetime.now()
format(now, '%Y-%m-%d %H:%M:%S')
# Out
'2018-12-28 20:52:25'
"It's now {:%I:%M %p}".format(now)
# Out
"It's now 08:52 PM"
now.strftime('Today is %D')
# Out
'Today is 12/28/18'
如果类没有定义
__format__
方法,从object
继承的方法会返回str(my_object)
,但是如果传入格式说明符就会抛出TypeError
format(v1)
# Out
'(3.0, 4.0)'
format(v1, '.3f')
# Out
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
in ()
----> 1 format(v1, '.3f')
TypeError: unsupported format string passed to Vector2d.__format__
自定义的格式代码选择字母时应该避免其他类型用过的
- 整数使用的代码:
'bcdoXn'
- 浮点数使用的代码:
'eEfFgGn%'
- 字符串使用的代码:
's'
在现有的 Vector 类的基础上实现自定义格式化,包括两点:
- 一般的格式化,分别进行向量两个分量的格式化,返回形式
(fmt_x, fmt_y)
- 格式化为极坐标,选用代码
'p'
,返回形式
(r
是模长,即已经实现的__abs__
方法;θ
是弧度)
# 计算弧度
def angle(self):
return math.atan2(self.y, self.x)
def __format__(self, fmt_spec=''):
# 格式化为极坐标
if fmt_spec.endwith('p'):
fmt_spec = fmt_spec[:-1]
coords = (abs(self), self.angle())
outer_fmt = '<{}, {}>'
else:
coords = self
outer_fmt = '({}, {})'
components = (format(c, fmt_spec) for c in coords)
return outer_fmt.format(*components)
关于自定义格式化的完整代码和测试,和之后的内容一起给出(不然代码会重复冗长)
5、可散列的Vector
类的实例可散列,需要满足以下三个条件:
- 实例不可变
- 实现
__hash__
方法- 实现
__eq__
方法
** 针对 Vector 类实现以上三个条件 **
1. 实例不可变
使用 私有属性 和 property
装饰器,将向量的两个分量设为只读属性,来保证实例“不可变”(因为属性不是真正的私有,所以不是真正的不可变)
class Vector2d:
def __init__(self, x, y):
self.__x = float(x)
self.__y = float(y)
@property
def x(self):
return self.__x
@property
def y(self):
return self.__y
def __iter__(self):
return (i for i in (self.x, self.y))
- 两个前导下划线标记属性为私有
-
@property
装饰器把读值方法标记为属性(方法名可以当作属性来使用,它们就是公共属性,就像__iter__
方法里面用的那样) - 之所以要实例不可变,是因为要实现
__hash__
方法和__eq__
方法,保证相等的对象具有相同的散列值
2. 实现 __hash__
方法
__hash__
方法应该返回一个整数,根据官方的文档,建议返回各分量散列值的异或值
def __hash__(self):
return hash(self.x) ^ hash(self.y)
3. 实现 __eq__
方法
之前已经实现
关于可散列 Vector 的完整代码和测试,和之后的内容一起给出(不然代码会重复冗长)
6、“私有”属性和“受保护”的属性
首先说明一点,Python 中没有像 Java 中那样的类似于
private
的限定修饰符,所以没有真正的实现私有和受保护,而是一种防护措施,更像是一种越定,就好比在 Java 中“私有”是法律规定,而在 Python 中“私有” 是道德规范
- 私有属性:防止某个属性在被直接使用或者是创建子类时被覆盖。Python 中使用两个前导下划线(尾部没有或者最多有一个下划线)命名的属性就是私有属性。
- 名称改写:被命名为私有的属性,会被内部改写成
_class__attr
的形式,被存入实例的__dict__
属性中。
class A:
def __init__(self, x):
self.__x = x
@property
def x(self):
return self.__x
a.x = 2
# Out
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
in ()
----> 1 a.x = 2
AttributeError: can't set attribute
a = A(1)
a.__dict__
# Out
{'_A__x': 1}
a._A__x = 2
所以实际上私有属性的名称改写仅仅是一种防护措施,避免无意地覆盖了我们所想的变量,但是如果是要故意通过改写后的名称来覆盖属性也没有被禁止。
一种比较好的处理属性的方案就是用 私有属性 + @property 装饰器,不去使用改名后的名称,而是使用我们真正想命名的名称。
对于前导单下划线的属性,Python 不会做任何处理,但却是一个不成文的约定,约定它是一个“私有的”或者是“受保护的”属性,避免意外覆盖属性。但是需要注意的是,不能用
from module import *
导入
7、__slots__
类属性
慎用
__slots__
类属性,在处理百万个属性不多的实例时,能够节省大量内存,它让解释器在元组中存储实例属性来代替字典(__dict__
);__slots__
类属性的值设为一个字符串构成的可迭代对象,一般是元组,其中每个元素表示各个实例属性;- 在类中定义了
__slots__
属性后,实例不能再有__slots__
中所列名称之外的其他属性;但是不要滥用它来禁止类的用户新增实例属性;- 如果把
'__dict__'
加入到__slots__
中,实例会在元组中保存各个实例的属性,也会支持动态创建属性,存在__dict__
中;__weakref__
实例属性为了让对象支持弱引用,自定义类中默认就有,但是如果定义了__slots__
属性,而且想支持弱引用,必须把'__weakref__'
加入__slots__
中。
8、覆盖类属性
Python 独特的特性:类属性可用于为实例属性提供默认值
就像 Vector 类中的 typecode
属性,定义为了类属性,并且可以通过 self.typecode
来访问。
- 如果实例本身并没有这个属性,就会使用类的同名属性,否则会用实例自己的属性
- 为不存在的 实例属性 赋值,会新建 实例属性,并且同名 类属性 不受影响
- 要修改 类属性 的值,必须直接通过类获取它然后修改,不能通过实例修改
一个更符合 Python 风格的覆盖类属性的方法:创建一个子类,只用于定制类的数据属性 (e.g. Django 基于子类的视图)
- 最终的Vector类代码以及测试 -
from array import array
import math
class Vector2d:
typecode = 'd'
def __init__(self, x, y):
self.__x = float(x)
self.__y = float(y)
@property
def x(self):
return self.__x
@property
def y(self):
return self.__y
def __iter__(self):
return (i for i in (self.x, self.y))
def __repr__(self):
class_name = type(self).__name__
return '{}({!r}, {!r})'.format(class_name, *self)
def __str__(self):
return str(tuple(self))
def __bytes__(self):
return bytes([ord(self.typecode)]) + bytes(array(self.typecode, self))
def __eq__(self, other):
return tuple(self) == tuple(other)
def __hash__(self):
return hash(self.x) ^ hash(self.y)
def __abs__(self):
return math.hypot(*self)
def __bool__(self):
return bool(abs(self))
def angle(self):
return math.atan2(self.y, self.x)
def __format__(self, fmt_spec):
if fmt_spec.endswith('p'):
fmt_spec = fmt_spec[:-1]
coords = (abs(self), self.angle())
outer_fmt = '<{}, {}>'
else:
coords = self
outer_fmt = '({}, {})'
components = (format(c, fmt_spec) for c in coords)
return outer_fmt.format(*components)
@classmethod
def frombytes(cls, octets):
typecode = chr(octets[0])
memv = memoryview(octets[1:]).cast(typecode)
return cls(*memv)
格式化测试
v1 = Vector2d(3, 4)
format(v1)
# Out
'(3.0, 4.0)'
format(v1, '.2f')
# Out
'(3.00, 4.00)'
format(v1, '.3e')
# Out
'(3.000e+00, 4.000e+00)'
format(v1, 'p')
# Out
'<5.0, 0.9272952180016122>'
format(v1, '.3ep')
# Out
'<5.000e+00, 9.273e-01>'
format(v1, '0.5fp')
# Out
'<5.00000, 0.92730>'
hash 测试
v2 = Vector2d(5, 12)
hash(v1), hash(v2)
# Out
(7, 9)
len(set([v1, v2]))
# Out
2
d = {}
d[v1] = 'Python'
d[Vector2d(3.0, 4.0)]
# Out
'Python'
md效果不好,原先是 jupyter notebook 版本