Java并发编程系列之一并发理论基础
本系列文章开始Java并发编程的进阶篇的学习,为了初学者对多线程的初步使用有基本概念和掌握,前置知识会对一些基础篇的内容进行介绍,以使初学者能够丝滑入戏。
多线程学习,真正的难点不在于多线程程序的逻辑有多复杂,而在于理清J.U.C包中各个多线程工具类之间的关系、特点及其使用场景,学习应该是从整体到局部、高屋建瓴,这对学习任何知识都至关重要。
站在上帝视角,以全局视野,抽丝剥茧,深入每个并发编程的各个包及APi的底层实现。
下图为并发编程包含的所有知识。读者大致浏览各个包及实现类,以做到心中有数。
毫无疑问JUC是并发编程的核心内容,也是我们文章笔墨重点,我们来看JUC包下所有的内容。JUC即 java.util.concurrent
使用多线程大大提高了CPU的利用效率,凡事有利皆有弊,那使用多线程会引发什么问题呢?
使用多线程会引发并发问题,如果多个线程对同一个共享数据进行访问而不采取同步操作的话,那么操作的结果是不一致的。
如果张三、李四、王二哥仨代表三个线程,哥仨只有一个钱包,张三取完钱还没记到账上,李四把钱又取走了,这样导致了数据不一致问题。
这样的问题是怎么引发的呢?
出现的根源就是CPU、内存、I/O 设备的速度是有极大差异的,为了合理利用 CPU 的高性能,平衡这三者的速度差异,计算机体系结构、操作系统、编译程序都做出了贡献,主要体现为:
可见性
问题原子性
问题有序性
问题可见性、原子性、有序性即为并发三要素,张三取钱没有同步到账上,也就是可见性问题。
我们重点说一下有序性。
int i = 0; boolean flag = false; i = 1; //语句1 flag = true; //语句2
上面代码定义了一个int型变量,定义了一个boolean类型变量,然后分别对两个变量进行赋值操作。
从代码顺序上看,语句1是在语句2前面的,那么JVM在真正执行这段代码的时候会保证语句1一定会在语句2前面执行吗?
不一定,为什么呢? 这里可能会发生指令重排序(Instruction Reorder)。
在执行程序时为了提高性能,编译器和处理器常常会对指令做重排序。重排序分三种类型:
从 Java 源代码到最终实际执行的指令序列,会分别经历下面三种重排序:
1 属于编译器重排序,2 和 3 属于处理器重排序。
这些重排序都可能会导致多线程程序出现内存可见性问题。
并发存在问题,语言的设计者们就要解决这些问题。
既然多线程存在这三个问题,那么Java就需要解决这三个问题。
1、针对原子性,Java内存模型只保证了基本读取和赋值是原子性操作,如果要实现更大粒度的原子性,可以通过synchronized和Lock来实现。
2、针对可见性,Java提供了volatile关键字来保证可见性。当一个共享变量被volatile修饰时,它会保证修改的值会立即被更新到主存,当有其他线程需要读取时,它会去内存中读取新值。,通过synchronized和Lock也能够保证可见性,synchronized和Lock能保证同一时刻只有一个线程获取锁然后执行同步代码,并且在释放锁之前会将对变量的修改刷新到主存当中。
3、针对有序性,使用先行发生原则(happens-before),让一个操作无需控制就能先于另一个操作完成。
而JUC的出现本质上也是为了解决这些问题,当然,这是后话。
不可变(Immutable)的对象一定是线程安全的,不需要再采取任何的线程安全保障措施。只要一个不可变的对象被正确地构建出来,永远也不会看到它在多个线程之中处于不一致的状态。
多线程环境下,应当尽量使对象成为不可变,来满足线程安全。
对于集合类型,可以使用 Collections.unmodifiableXXX() 方法来获取一个不可变的集合。
今天的并发编程的基础理论知识就聊到这,主要引出了为什么要使用多线程,使用多线程会造成什么问题及怎么解决这些问题的理论知识,下篇开始介绍如何使用java中的多线程。