keep函数可以从原始数据中抽取符合指定条件的子集。
from clumper import Clumper list_dicts = [{'a': 1}, {'a': 2}, {'a': 3}, {'a': 4}] (Clumper(list_dicts) .keep(lambda d: d['a'] >= 3) .collect() #试一试去掉.collect()后的效果 )
[{'a': 3}, {'a': 4}]
可以实现缺失值处理,以不同的方式实现pandas的.dropna()
的功能。
from clumper import Clumper data = [ {"a": 1, "b": 4}, {"a": 2, "b": 3}, {"a": 3, "b": 2}, {"a": 4}, ] #只保留含有b的字段 (Clumper(data) .keep(lambda d: 'b' in d.keys()) .collect() )
[{'a': 1, 'b': 4}, {'a': 2, 'b': 3}, {'a': 3, 'b': 2}]