你好,我是悦创。
❝不理解的地方可以去我博客留言噢,或者公众号后台回复数字“3”加小编(记得备注来意)拉你入交流群!
❞
我们知道,在一台计算机中,我们可以同时打开许多软件,比如同时浏览网页、听音乐、打字等等,看似非常正常。但仔细想想,为什么计算机可以做到这么多软件同时运行呢?这就涉及到计算机中的两个重要概念:多进程和多线程了。
同样,在编写爬虫程序的时候,为了提高爬取效率,我们可能想同时运行多个爬虫任务。这里同样需要涉及多进程和多线程的知识。
本课时,我们就先来了解一下多线程的基本原理,以及在 Python 中如何实现多线程。
❝「全局解释器锁」 (英语:Global Interpreter Lock,缩写 「GIL」)
是 「计算机程序设计语言解释器」 用于 「同步线程」 的一种机制,它使得任何时刻仅有 「一个线程」 在执行,即便在 「多核心处理器」 上,使用 「GIL」 的解释器也只允许同一时间执行一个线程。常见的使用 「GIL」 的解释器有 「CPython」 与 「Ruby MRI」。
❞
如果,你对上面的不理解,也没有问题。通俗的解释就是:你电脑是 「一核或者多核」 ,还是你的代码写了了多个线程,但因为 「GIL」 锁的存在你也就只能运行一个线程,无法同时运行多个线程。
接下来,我们来用个图片来解释一下:
比如图中,假如你开了两个线程(「Py thread1」 、「Py tread2」),
① Create > ② GIL > ③ 申请原生线程(OS) > ④ CPU 执行(如果有其他线程,都会卡在 Python 解释器的外边)