场景:在海量数据中(10亿无序,不定长,不重复)快速判断一个元素是否存在?
布隆过滤器本质:1.位数组(二进制向量)
2.一系列随机映射函数
如下图 ==>
原理:
如果一个元素3个函数返回的结果是false 即有 一个是0,那这个元素肯定不存在。
如果一个元素3个函数返回的结果是true 即都是1,那这个元素也不一定肯定存在,因为可能是其他元素hash后的结果。