一、什么是GIL
GIL即全局解释锁(global interpreter lock),这个锁环绕着Ruby代码的执行,在一个多线程上下文中,任何时候只有一个线程可以执行Ruby代码。因此即使在多核的机器上运行多线程应用,在特定时间点上也只有一个线程和一个核心在忙碌,GIL一直保护着Ruby内核,以免竞争条件造成数据混乱。
二、GIL产生原因
首先,Ruby线程依托于原生操作系统线程,所以Ruby线程的调度也是源于操作系统的线程调度程序。其次,对于Ruby来说其实没有什么操作是线程安全的,比如最简单的数组附加,如下:
arr = [] arr << ‘str1’
Ruby中的数组附加其实包含许多步骤,在其底层实现上是包含一大堆代码:
VALUE rb_ary_push(VALUE ary, VALUE iterm) { long idx = RARRAY_LEN(ary); ary_ensure_room_for_push(ary, 1); RARRAY_ASET(ary, idx, item); ARY_SET_LEN(ary, idx + 1); return ary; }
这段代码揭示了数据附加包含以下几个步骤:
1. 获取数组当前长度;
2. 检查数组是否有空间容纳新的元素;
3. 将元素附加到数组;
4. 修改数据长度+1。
由于这么一系列操作不是线程安全的,所以在多线程应用中,会频繁发生上下文切换,这样就可能会发生一些匪夷所思的错误,为此,我们需要使这些操作具有原子性,所以我们需要使用GIL来解决这个问题。GIL保卫着系统的内部状态,使用GIL,就不需要在数据结构周围使用任何锁或者同步机制。如果两个线程不能够同时改变内部状态,也就不会有竞争条件发生了。
三、GIL的实现原理
Ruby的线程依托于原生的操作系统的线程,但是当一个Ruby线程希望在其原生操作系统线程中执行代码的时,必须要先获得GIL,如下图所示,在特定时间点上只有一个线程可以获取GIL,于是Ruby的代码执行是完全不能并行的。
那么Ruby如何保证GIL被线程独霸呢?Ruby提供了一个计时器线程,这个线程是仅存在于Ruby内部的原生线程,当Ruby启动并只有主线程运行时,定时器线程处于沉睡状态,但一旦有线程等待GIL,定时器线程就会被唤醒。定时器线程是用于避免一个线程独霸GIL的情况,每经过一定周期,定时器线程在当前持有GIL的线程上设置一个中断标志,Ruby会检查这些中断标志,被设置中断标志的线程会停止运行并释放GIL,这样,别的线程就可以获取GIL继而执行其代码。
四、总结
GIL是Ruby内部实现细节,是为了保证Ruby内部执行的安全,它保证了Ruby中C实现的底层方法的原子性。
PS:以上内容都是基于CRuby的,对于JRuby或者Rubinius来说,它们是可以真正做到多线程并发执行的。