Java软件开发 | 高并发编程篇之——安全访问的集合(1)
在开发中我们使用比较多的集合就是List、Set和Map了,并且我们也知道大部分用的基本上都是ArrayList、LinkedList、HashMap、HashSet或者TreeSet这几个集合。
但是我们在学习使用它们的时候都知道它们这几个在并发处理的时候并不会保证多线程的安全访问,也就是说多线程环境下使用这几个集合不能用于共享数据访问。
那有没有一些方法保证这些集合并发安全访问呢?
- Collections工具类并发的支持
其实java有一个叫做Collections的工具类提供了一些保证List、Set、Map线程安全方法的方法,如下图:
其实通过其名称也不难猜想底层是使用了synchronized关键完成的同步代码块或者同步方法的实现。
其任意一个方法的源码如下(以List为例):
- 支持并发安全访问的集合
① ConcurrentHashMap
HashMap原理简介
我们知道HashMap的底层实现原理是分JDK1.7及其以前版本和JDK1.8版本的,JDK1.7及其以前HashMap是使用“数组+链表”组成的“散列桶”的实现,这个“桶”即为“数组”,默认容量为16,在每一个“桶”中存储了一个链表,但是链表一旦太长就会导致查找速度很慢(链表查找需要遍历),所以在JDK1.8的时候HashMap存储结构改为了当链表长度达到8之后(通过判断TREEIFY_THRESHOLD的值)将链表改为红黑二叉树的存储,这样对于数据操作的效率就大大提高了。
JDK8之后的HashMap如图:
部分源码如下:
HashMap对其数据操作并没有做线程安全的处理,HashMap在其插入数据的时候都要进行容量检查看有没有超过设定的thredhold,如果超过,则需要扩容,但是这样一来,就需要对整个HashMap里的节点进行重哈希操作,那么如果现在多个线程访问HashMap数据那可能导致一个线程操作了之后HashMap进行哈希重新计算操作,另外一个线程读取到的就不准确,所以操作过程中并不是线程安全的。
ConcurrentHashMap原理简介
ConcurrentHashMap是J.U.C(java.util.concurrent包)的重要成员,它是一个线程安全却效率相对高效一些的类似HashMap的实现类。
ConcurrentHashMap 的实现同样也分为JDK7和JDK8版本。
JDK7及其之前底层采用是“数组+链表+Segment分段锁”的实现。其中Segment继承了ReentrantLock,这样ConcurrentHashMap 每个数组中的元素既是一个链表,又是一个Segment锁,使用Segment将访问的数据分成了一段一段的进行存储,因为每一个Segment都是一个锁所以相当于每一段数据也加了锁,这样就可以每一段锁支持一个线程访问,即保证了线程安全又降低了锁的粒度,大大提高了并发操作的效率。
JDK8之后ConcurrentHashMap也同样参考了HashMap的设计,采用了“数组+链表+红黑树”的实现方式,但是却舍弃了“Segment分段锁”的设计(虽然JDK8的源码中还能够看到Segment类但是已经大大简化了代码设计主要为了JDK版本兼容设计)。
在JDK8的版本它存储的链表或者红黑树都使用了volatile关键字修饰,但是又因为volatile只是能保证线程的可见性和有序性不能够保证原子性操作,所以在进行put等操作的时候还使用了synchronized代码块处理。
部分核心源码如下图所示:
它采用了synchronized 和 CAS(往期文章中有介绍CAS操作) 来替代JDK7的Segment分段锁的实现,JDK8中采用Synchronized关键字也是因为它在JDK6之后做了自旋、锁粗化、锁消除、锁升级等优化,另外对比于JDK7的Segment分段锁的是多个HashEntry,而JDK8锁的是单个的HashEntry粒度更小,效率更高。并且考虑到JDK可能对JVM底层synchronized关键字还会进行不断的优化所以JDK采用了synchronized的设计。
总的来说ConcurrentHashMap是我们在并发访问下的不错的HashMap的替换者。