《你不知道的 WeakMap》番外篇

本文主要是介绍《你不知道的 WeakMap》番外篇，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

学习时间：2020.05.26
学习章节：《你不知道的 WeakMap》

一、主要知识点

原文主要复习了“JavaScript垃圾回收机制”，“Map/WeakMap区别”和“WeakMap 属性和方法”。这很好弥补被我忽视的知识点。
另外，我们可以通过原文，以相同方式再去学 Set/WeakSet，效果会更好，本文后面也会介绍到。

总结开始，先看原文大纲：

在开始介绍 WeakMap 之前，先复习一遍 JavaScript 中垃圾回收机制，这跟后面的 WeakMap/WeakSet 关系较大。

1. 垃圾回收机制

垃圾回收（Garbage Collection，缩写为GC）)是一种自动的存储器管理机制。当某个程序占用的一部分内存空间不再被这个程序访问时，这个程序会借助垃圾回收算法向操作系统归还这部分内存空间。垃圾回收器可以减轻程序员的负担，也减少程序中的错误。垃圾回收最早起源于LISP语言。
目前许多语言如Smalltalk、Java、C#和D语言都支持垃圾回收器，我们熟知的 JavaScript 具有自动垃圾回收机制。

在 JavaScript 中，原始类型的数据被分配到栈空间中，引用类型的数据会被分配到堆空间中。
**

1.1 栈空间中的垃圾回收

当函数 showName 调用完成后，通过下移 ESP（Extended Stack Pointer）指针，来销毁 showName 函数，之后调用其他函数时，将覆盖掉旧内存，存放另一个函数的执行上下文，实现垃圾回收。

图片来自《浏览器工作原理与实践》

1.2 堆空间中的垃圾回收

堆中数据垃圾回收策略的基础是：代际假说（The Generational Hypothesis）。即：

大部分对象在内存中存在时间极短，很多对象很快就不可访问。
不死的对象将活得更久。

这两个特点不仅仅适用于 JavaScript，同样适用于大多数的动态语言，如 Java、Python 等。

V8 引擎将堆空间分为新生代（存放生存时间短的对象）和老生代（存放生存时间长的对象）两个区域，并使用不同的垃圾回收器。

副垃圾回收器，主要负责新生代的垃圾回收。
主垃圾回收器，主要负责老生代的垃圾回收。

不管是哪种垃圾回收器，都使用相同垃圾回收流程：标记活动对象和非活动对象，回收非活动对象的内存，最后内存整理。
**

1.2.1 副垃圾回收器

使用 Scavenge 算法处理，将新生代空间对半分为两个区域，一个对象区域，一个空闲区域。

图片来自《浏览器工作原理与实践》

执行流程：

新对象存在在对象区域，当对象区域将要写满时，执行一次垃圾回收；
垃圾回收过程中，首先对对象区域中的垃圾做标记，然后副垃圾回收器将存活的对象复制并有序排列到空闲区域，相当于完成内存整理。
复制完成后，将对象区域和空闲区域翻转，完成垃圾回收操作，这也让新生代中两块区域无限重复使用。

当然，这也存在一些问题：若复制操作的数据较大则影响清理效率。

JavaScript 引擎的解决方式是：将新生代区域设置得比较小，并采用对象晋升策略（经过两次回收仍存活的对象，会被移动到老生区），避免因为新生代区域较小引起存活对象装满整个区域的问题。

1.2.2 主垃圾回收器

分为：标记 - 清除（Mark-Sweep）算法，和标记 - 整理（Mark-Compact）算法。

a)标记 - 清除（Mark-Sweep）算法
过程：

标记过程：从一组根元素开始遍历整个元素，能到达的元素为活动对象，反之为垃圾数据；
清除过程：清理被标记的数据，并产生大量碎片内存。（缺点：导致大对象无法分配到足够的连续内存）

图片来自《浏览器工作原理与实践》

b)标记 - 整理（Mark-Compact）算法
过程：

标记过程：从一组根元素开始遍历整个元素，能到达的元素为活动对象，反之为垃圾数据；
整理过程：将所有存活的对象，向一段移动，然后清除端边界以外的内容。

图片来自《浏览器工作原理与实践》

1.3 拓展阅读

1.《图解Java 垃圾回收机制》
2.《MDN 内存管理》

2. Map VS WeakMap

2.1 Map 和 WeakMap 主要区别

WeakMap 结构与 Map 结构类似，也是用于生成键值对的集合。
区别：

Map 对象的键可以是任何类型，但 WeakMap 对象中的键只能是对象引用（ null 除外）；

const map = new WeakMap();
map.set(1, 2)
// TypeError: 1 is not an object!
map.set(Symbol(), 2)
// TypeError: Invalid value used as weak map key
map.set(null, 2)
// TypeError: Invalid value used as weak map key

WeakMap 不能包含无引用的对象，否则会被自动清除出集合（垃圾回收机制）；
WeakMap 对象没有 size 属性，是不可枚举的，无法获取集合的大小。

const map = new WeakMap();
const user1 = {name: 'leo'};
const user2 = {name: 'pingan'};
map.set(user1, 'good~');
map.set(user2, 'hello');
map.map(item => console.log(item))
//Uncaught TypeError: map.map is not a function

2.2 Map 缺点和 WeakMap 优点

1.赋值和搜索操作都是 O(n) 的时间复杂度，因为这两个操作都需要遍历全部整个数组来进行匹配。
2.可能会导致内存泄漏，因为数组会一直引用着每个键和值。

相比之下， WeakMap 持有的是每个键对象的 “弱引用”，这意味着在没有其他引用存在时垃圾回收能正确进行。原生 WeakMap 的结构是特殊且有效的，其用于映射的 key 只有在其没有被回收时才是有效的。

2.3 Map 和 WeakMap 垃圾回收对比

当数据量越大，则垃圾回收效果越明显。
通过命令行执行 node --expose-gc weakmap.js 查看对比效果。
其中 --expose-gc 参数表示允许手动执行垃圾回收机制。

// weakmap.js
const objNum = 10 * 1024 * 1024;
const useType = 1; // 修改 useType 值来测试Map和WeakMap
const curType = useType == 1 ?"【Map】" : "【WeakMap】";
let arr = new Array(objNum);

function usageSize() {
    const used = process.memoryUsage().heapUsed;
    return Math.round((used / 1024 / 1024) * 100) / 100 + "M";
}

if (useType == 1) {
    global.gc();
    console.log(objNum + '个' + curType + '占用内存：' + usageSize());

    const map = new Map();
    map.set(arr, 1);

    global.gc();
    console.log(objNum + '个' + curType + '占用内存：' + usageSize());

    arr = null;
    global.gc();
    console.log(objNum + '个' + curType + '占用内存：' + usageSize());

    console.log("=====")
} else {
    global.gc();
    console.log(objNum + '个' + curType + '占用内存：' + usageSize());

    const map = new WeakMap();

    global.gc();
    console.log(objNum + '个' + curType + '占用内存：' + usageSize());

    arr = null;
    global.gc();
    console.log(objNum + '个' + curType + '占用内存：' + usageSize());

    console.log("=====")
}

3. WeakMap介绍和应用

3.1 WeakMap 介绍

WeakMap 对象是一组键/值对的集合，其中的键是 弱引用 的。
WeakMap 的 key 只能是 Object 类型。
原始数据类型是不能作为 key 的（比如 Symbol）。
WeakMap只有四个方法可用：get()、set()、has()、delete()。
**
具体属性和方法介绍，可查看《MDN WeakMap》。

3.2 WeakMap 应用

原文中介绍了“通过 WeakMap 缓存计算结果”和“在 WeakMap 中保留私有数据”两种应用场景。
另外还有一种比较常见的场景：以 DOM节点作为键名的场景。

场景1：当我们想要为DOM添加数据时，可使用 WeakMap 。
好处在于，当DOM元素移除时，对应 WeakMap 记录也会自动移除：

<div id="WeakMap"></div>

const wm = new WeakMap();
const weakMap = document.getElementById('WeakMap');
wm.set(weakMap, 'some information');
wm.get(weakMap) //"some information"

场景2：当我们想要为DOM元素添加事件监听时，可使用 WeakMap 。

<button id="button1">按钮1</button>
<button id="button2">按钮2</button>

const button1 = document.getElementById('button1');
const button2 = document.getElementById('button2');
const handler1 = () => {  console.log("button1 被点击") };
const handler2 = () => {  console.log("button2 被点击") };

// 代码1
button1.addEventListener('click', handler1, false);
button2.addEventListener('click', handler2, false);
 
// 代码2
const listener = new WeakMap();
 
listener.set(button1, handler1);
listener.set(button2, handler2);
 
button1.addEventListener('click', listener.get(button1), false);
button2.addEventListener('click', listener.get(button2), false);

代码2比起代码1的好处是：由于监听函数是放在 WeakMap 里面，
则一旦 DOM 对象button1 / button2消失，与它绑定的监听函数handler1和handler2 也会自动消失。

二、拓展知识

1. 拓展 Set/WeakSet

1.1 Set 和 WeakSet 主要区别

WeakSet 结构与 Set 类似，也是不重复的值的集合。
区别：

WeakSet 的成员只能是对象，而不能是其他类型的值；

const ws = new WeakSet();
ws.add(1)
// TypeError: Invalid value used in weak set
ws.add(Symbol())
// TypeError: invalid value used in weak set

WeakSet 中的对象都是弱引用，即垃圾回收机制不考虑 WeakSet 对该对象的引用;
WeakSet 对象没有 size 属性，是不可枚举的，无法获取集合的大小。

1.2 Set/WeakSet 垃圾回收对比

通过命令行执行 node --expose-gc weakset.js 查看对比效果。

// weakset.js
const objNum = 5000 * 1024;
const useType = 1;
const curType = useType == 1 ?"【Set】" : "【WeakSet】";
let obj = [];
for (let k = 0; k < objNum; k++) {
    obj[k] = {}
}

function usageSize() {
    const used = process.memoryUsage().heapUsed;
    return Math.round((used / 1024 / 1024) * 100) / 100 + "M";
}

if (useType == 1) {
    global.gc();
    console.log(objNum + '个' + curType + '占用内存：' + usageSize());

    const sets = new Set([...obj]);

    global.gc();
    console.log(objNum + '个' + curType + '占用内存：' + usageSize());

    obj = null;
    global.gc();
    console.log(objNum + '个' + curType + '占用内存：' + usageSize());

    console.log("=====")
} else {
    global.gc();
    console.log(objNum + '个' + curType + '占用内存：' + usageSize());

    const sets = new WeakSet(obj);

    global.gc();
    console.log(objNum + '个' + curType + '占用内存：' + usageSize());

    obj = null;
    global.gc();
    console.log(objNum + '个' + curType + '占用内存：' + usageSize());

    console.log("=====")
}

三、总结

本文首先复习了《你不知道的 WeakMap》中核心知识点，重新回顾了“垃圾回收机制”，“Map VS WeakMap”和“WeakMap 介绍和应用”，最后延伸复习了“Set/WeakSet”相关知识点。
在实际业务开发中，最好也能考虑垃圾回收机制的合理使用，这也是提升产品性能的一个非常常用的方式。

这篇关于《你不知道的 WeakMap》番外篇的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

HTML5教程

《你不知道的 WeakMap》番外篇

一、主要知识点

1. 垃圾回收机制

1.1 栈空间中的垃圾回收

1.2 堆空间中的垃圾回收

1.2.1 副垃圾回收器

1.2.2 主垃圾回收器

1.3 拓展阅读

2. Map VS WeakMap

2.1 Map 和 WeakMap 主要区别

2.2 Map 缺点和 WeakMap 优点

2.3 Map 和 WeakMap 垃圾回收对比

3. WeakMap介绍和应用

3.1 WeakMap 介绍

3.2 WeakMap 应用

二、拓展知识

1. 拓展 Set/WeakSet

1.1 Set 和 WeakSet 主要区别

1.2 Set/WeakSet 垃圾回收对比

三、总结

前端开发

后端开发

移动端开发

数据库

服务器运维

人工智能

区块链

游戏开发

网站运营

大数据/云计算

软件工程

软件/开发工具使用

资讯