Python中有许多内置函数,不像print、len那么广为人知,但它们的功能却异常强大,用好了可以大大提高代码效率,同时提升代码的简洁度,增强可阅读性
collections在python官方文档中的解释是High-performance container datatypes,直接的中文翻译解释高性能容量数据类型。这个模块实现了特定目标的容器,以提供Python标准内建容器 dict , list , set , 和 tuple 的替代选择。在python3.10.1中它总共包含以下几种数据类型:
容器名 | 简介 |
---|---|
namedtuple() | 创建命名元组子类的工厂函数 |
deque | 类似列表(list)的容器,实现了在两端快速添加(append)和弹出(pop) |
ChainMap | 类似字典(dict)的容器类,将多个映射集合到一个视图里面 |
Counter | 字典的子类,提供了可哈希对象的计数功能 |
OrderedDict | 字典的子类,保存了他们被添加的顺序 |
defaultdict | 字典的子类,提供了一个工厂函数,为字典查询提供一个默认值 |
UserDict | 封装了字典对象,简化了字典子类化 |
UserList | 封装了列表对象,简化了列表子类化 |
UserString | 封装了字符串对象,简化了字符串子类化 |
其中Counter中文意思是计数器,也就是我们常用于统计的一种数据类型,在使用Counter之后可以让我们的代码更加简单易读。Counter类继承dict类,所以它能使用dict类里面的方法
#统计词频 fruits = ['apple', 'peach', 'apple', 'lemon', 'peach', 'peach'] result = {} for fruit in fruits: if not result.get(fruit): result[fruit] = 1 else: result[fruit] += 1 print(result) #{'apple': 2, 'peach': 3, 'lemon': 1}
下面我们看用Counter怎么实现:
from collections import Counter fruits = ['apple', 'peach', 'apple', 'lemon', 'peach', 'peach'] c = Counter(fruits) print(dict(c)) #{'apple': 2, 'peach': 3, 'lemon': 1}
显然代码更加简单了,也更容易阅读和维护了。
>>> c = Counter(a=4, b=2, c=0, d=-2) >>> sorted(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b']
>>> Counter('abracadabra').most_common(3) [('a', 5), ('b', 2), ('r', 2)]
这两个方法是Counter中最常用的方法,其他方法可以参考python3.10.1官方文档
Leetcode 1002.查找共用字符
给你一个字符串数组words,请你找出所有在words的每个字符串中都出现的共用字符(包括重复字符),并以数组形式返回。你可以按任意顺序返回答案。
输入:words = ["bella", "label", "roller"] 输出:["e", "l", "l"] 输入:words = ["cool", "lock", "cook"] 输出:["c", "o"]
看到统计字符,典型的可以用Counter完美解决。这道题是找出字符串列表里面每个元素都包含的字符,首先可以用Counter计算出每个元素每个字符出现的次数,依次取交集最后得出所有元素共同存在的字符,然后利用elements输出共用字符出现的次数
class Solution: def commonChars(self, words: List[str]) -> List[str]: from collections import Counter ans = Counter(words[0]) for i in words[1:]: ans &= Counter(i) return list(ans.elements())
提交一下,发现83个测试用例耗时48ms,速度还是不错的
在处理数据过程中,我们经常会用到排序操作,比如将列表、字典、元组里面的元素正/倒排序。这时候就需要用到sorted(),它可以对任何可迭代对象进行排序,并返回列表
a = sorted([2, 4, 3, 7, 1, 9]) print(a) # 输出:[1, 2, 3, 4, 7, 9]
sorted((4,1,9,6),reverse=True) print(a) # 输出:[9, 6, 4, 1]
fruits = ['apple', 'watermelon', 'pear', 'banana'] a = sorted(fruits, key = lambda x : len(x)) print(a) # 输出:['pear', 'apple', 'banana', 'watermelon']
all() 函数用于判断给定的可迭代参数iterable中的所有元素是否都为 TRUE,如果是返回 True,否则返回 False。元素除了是 0、空、None、False外都算True。注意:空元组、空列表返回值为True。
>>> all(['a', 'b', 'c', 'd']) # 列表list,元素都不为空或0 True >>> all(['a', 'b', '', 'd']) # 列表list,存在一个为空的元素 False >>> all([0, 1,2, 3]) # 列表list,存在一个为0的元素 False >>> all(('a', 'b', 'c', 'd')) # 元组tuple,元素都不为空或0 True >>> all(('a', 'b', '', 'd')) # 元组tuple,存在一个为空的元素 False >>> all((0, 1, 2, 3)) # 元组tuple,存在一个为0的元素 False >>> all([]) # 空列表 True >>> all(()) # 空元组 True
any函数正好和all函数相反:判断一个tuple或者list是否全为空,0,False。如果全为空,0,False,则返回False;如果不全为空,则返回True。
在python3.6.2版本中,PEP 498提出一种新型字符串格式化机制,被称为 “字符串插值” 或者更常见的一种称呼是F-strings,F-strings提供了一种明确且方便的方式将python表达式嵌入到字符串中来进行格式化:
s1='Hello' s2='World' print(f'{s1} {s2}!') # Hello World!
在F-strings中我们也可以执行函数:
def power(x): return x*x x=4 print(f'{x} * {x} = {power(x)}') # 4 * 4 = 16
而且F-strings的运行速度很快,比传统的%-string和str.format()这两种格式化方法都快得多,书写起来也更加简单。