大家好,我是征哥,在我看过的 Python 教程中,很少讨论有懒属性的,今天分享 Python 的懒属性技术,可以提升程序的性能。
懒加载是一种编程范式,它推迟加载操作,直到不得不这样做。通常,当操作开销很大,需要耗费大量时间或空间时,惰性求值是首选实现。例如,在 Python 中,涉及惰性求值的最著名技术之一是生成器。生成器不是为迭代创建整个序列,而是懒惰地一次生成一个元素。
在 Python 世界之外,许多其他面向对象的编程语言,例如 Swift 和 Kotlin,都具有与对象相关的惰性求值。具体来说,你可以指定自定义实例对象的特定属性是惰性的,这意味着在显式访问这些属性之前不会创建这些属性。
在我们开始讨论懒属性之前,有些人可能想知道为什么它很重要,或者我们为什么要使用懒属性。
比如在社交网站中,一个功能是查看一个人的关注者,以列表的形式呈现。当我们点击一个用户时,我们可以在弹出窗口中查看该用户的个人资料。获取用户个人资料数据的操作可能很昂贵,不仅需要访问远程服务器,还需要将数据存储在内存中。
那么在编程实现时可以把关注者的个人资料作为懒属性,仅在点击特定用户名时才获取该属性。
这就是为什么我们需要懒属性。
@property 是一个装饰器,可以将常规函数转化为属性,比如支持点符号访问。因此,严格来说,创建属性并不是真正创建懒属性本身。相反,它只是提供一个接口来简化数据处理的问题。让我们先看看下面的代码。
class User: def __init__(self): self._profile_data = None @property def profile_data(self): if self._profile_data is None: print("执行耗时操作...") self._profile_data = 'profile data' return self._profile_data demo = User() print("init done") print(demo.profile_data) #init done #执行耗时操作... #profile data
初始化完成后并不会执行耗时操作,对应的加载用户列表就不会觉得卡。只有在获取用户资料(点击操作)时,程序会先判断是否已经存在 _profile_data,没有才会执行耗时操作,如果有直接返回,大大提升了效率。
在 Python 中,名称前后有双下划线的函数称为魔术方法。__getattr__ 可以帮助我们实现懒属性。
对于自定义类,实例对象的属性保存在字典中,可以访问实例对象的 __dict__ 属性获取。值得注意的是,如果__dict__ 不包含指定的属性,Python 将会调用魔术方法 __getattr__,写个代码你就明白了:
class User: def __init__(self): self._profile_data = None self.name = 'None' def __getattr__(self, item): print("called __getattr__") if item == 'profile_data': if self._profile_data is None: print("执行耗时操作...") self._profile_data = 'profile data' return self._profile_data user = User() print("init done") print(user.__dict__) print(user.profile_data) print(user.__dict__) print(user.name)
输出结果如下:
init done {'_profile_data': None, 'name': 'None'} called __getattr__ 执行耗时操作... profile data {'_profile_data': 'profile data', 'name': 'None'} None
和方法 1 一样,初始化完成后并不会执行耗时操作,我们在获取 profile_data 属性时,由于 profile_data 不在 __dict__ 中,因此会执行 __getattr__ 方法获取,而 name 在 __dict__ 获取 name 属性时根本就不会执行 __getattr__ 方法。
怎么判断一个属性是不是在 __dict__ 中呢,只要没有显式的定义该属性,或者使用 setattr 来设置属性,它就不会在 __dict__ 中。
因此可以借助魔术方法 __getattr__ 来创建懒属性 profile_data。
需要注意,Python 还有一个类似的魔术方法 __getattribute__,与 __getattr__ 方法不同的是, 每次获取属性时都会调用 __getattribute__ 方法。
class User: def __init__(self): self._profile_data = None self.name = 'None' def __getattribute__(self, item): print("called __getattr__") user = User() print("init done") print(user.profile_data) print(user.name)
程序输出如下:
init done called __getattr__ None called __getattr__ None
此功能仅在你期望属性非常频繁地更改并且只有最新数据相关时才有用。在这些情况下,我们可以通过定义相关函数来实现效果。换句话说,我不建议你尝试使用它,因为很容易陷入无限递归循环。
在本文中,我们重点讨论了在 Python 中实现懒属性的两种实用方法:一种使用 @property 装饰器,另一种使用 __getattr__ 特殊方法。
就我个人而言,我更喜欢使用属性装饰器,它更直接、更容易理解。但是,当你需要定义多个懒属性时,该 getattr 方法更好,因为它提供了一个集中的地方来管理这些懒属性。
关注「Python七号」,每周学习一个 Python 小技术。