【搞定Java并发编程】第6篇:ThreadLocal详解

落日映苍穹つ 2022-04-11 13:30 325阅读 0赞

上一篇:synchronized关键字:https://blog.csdn.net/pcwl1206/article/details/84849400

目 录:

1、ThreadLocal是什么?

2、ThreadLocal使用示例

3、ThreadLocal源码分析

3.1、ThreadLocalMap

3.2、get()

3.3、set(T value)

3.4、initialValue()

3.5、remove()

4、ThreadLocal为什么会内存泄漏

5、总结


1、ThreadLocal是什么?

ThreadLocal是啥?以前面试别人时就喜欢问这个,有些伙伴喜欢把它和线程同步机制混为一谈,事实上ThreadLocal与线程同步无关。ThreadLocal虽然提供了一种解决多线程环境下成员变量的问题,但是它并不是解决多线程共享变量的问题。那么ThreadLocal到底是什么呢?

API是这样介绍它的:

This class provides thread-local variables. These variables differ from their normal counterparts in that each thread that accesses one (via its {@code get} or {@code set} method) has its own, independently initialized copy of the variable. {@code ThreadLocal} instances are typically private static fields in classes that wish to associate state with a thread (e.g.,a user ID or Transaction ID).

翻译过来就是:

该类提供了线程局部 (thread-local) 变量。这些变量不同于它们的普通对应物,因为访问某个变量(通过其get set方法)的每个线程都有自己的局部变量,它独立于变量的初始化副本。ThreadLocal实例通常是类中的 private static 字段,它们希望将状态与某一个线程(例如,用户 ID 或事务 ID)相关联。

所以ThreadLocal与线程同步机制不同,线程同步机制是多个线程共享同一个变量,而ThreadLocal是为每一个线程创建一个单独的变量副本,故而每个线程都可以独立地改变自己所拥有的变量副本,而不会影响其他线程所对应的副本。可以说ThreadLocal为多线程环境下变量问题提供了另外一种解决思路。

ThreadLocal定义了四个方法:

1、get():返回此线程局部变量的当前线程副本中的值;

2、initialValue():返回此线程局部变量的当前线程的“初始值”;

3、remove():移除此线程局部变量中当前线程的值;

4、set(T value):将此线程局部变量的当前线程副本中的值设置为指定值。

除了这四个方法,ThreadLocal内部还有一个静态内部类ThreadLocalMap**,该内部类才是实现线程隔离机制的关键,get()、set()、remove()都是基于该内部类操作ThreadLocalMap提供了一种用键值对方式存储每一个线程的变量副本的方法,key为当前ThreadLocal对象,value则是对应线程的变量副本**。

对于ThreadLocal需要注意的有两点:

  1. ThreadLocal实例本身是不存储值,它只是提供了一个在当前线程中找到副本值的key;

  2. 是ThreadLocal包含在Thread中,而不是Thread包含在ThreadLocal中,有些小伙伴会弄错他们的关系。

下图是Thread、ThreadLocal、ThreadLocalMap的关系:

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3Bjd2wxMjA2_size_16_color_FFFFFF_t_70 该图片来自: http://blog.xiaohansong.com/2016/08/06/ThreadLocal-memory-leak/


2、ThreadLocal使用示例

  1. public class SeqCount {
  2. private static ThreadLocal<Integer> seqCount = new ThreadLocal<Integer>(){
  3. // 实现initialValue
  4. public Integer initialValue(){
  5. return 0;
  6. }
  7. };
  8. public int nextSeq(){
  9. seqCount.set(seqCount.get() + 1);
  10. return seqCount.get();
  11. }
  12. public static void main(String[] args) {
  13. SeqCount seqCount = new SeqCount();
  14. SeqThread thread1 = new SeqThread(seqCount);
  15. SeqThread thread2 = new SeqThread(seqCount);
  16. SeqThread thread3 = new SeqThread(seqCount);
  17. SeqThread thread4 = new SeqThread(seqCount);
  18. thread1.start();
  19. thread2.start();
  20. thread3.start();
  21. thread4.start();
  22. }
  23. }
  24. public class SeqThread extends Thread {
  25. private SeqCount seqCount;
  26. SeqThread(SeqCount seqCount) {
  27. this.seqCount = seqCount;
  28. }
  29. public void run() {
  30. for (int i = 0; i < 3; i++) {
  31. System.out.println(Thread.currentThread().getName() + " seqCount :" + seqCount.nextSeq());
  32. }
  33. }
  34. }

运行结果:

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3Bjd2wxMjA2_size_16_color_FFFFFF_t_70 1

从运行结果可以看出,ThreadLocal确实是可以达到线程隔离机制,确保变量的安全性。这里我们想一个问题,在上面的代码中ThreadLocal的initialValue()方法返回的是0,假如该方法返回的是一个对象呢,会产生什么后果呢?例如:

  1. A a = new A();
  2. private static ThreadLocal<A> seqCount = new ThreadLocal<A>(){
  3. // 实现initialValue()
  4. public A initialValue() {
  5. return a;
  6. }
  7. };
  8. class A{
  9. // ....
  10. }
  • 具体过程请参考:对ThreadLocal实现原理的一点思考

3、ThreadLocal源码分析

ThreadLocal虽然解决了这个多线程变量的复杂问题,但是它的源码实现却是比较简单的。ThreadLocalMap是实现ThreadLocal的关键,我们先从它入手。

3.1、ThreadLocalMap

ThreadLocalMap是ThreadLocal中的一个静态内部类。ThreadLocalMap其内部利用Entry来实现key-value的存储,如下:

  1. public class ThreadLocal<T> {
  2. // ... 其他方法
  3. static class ThreadLocalMap {
  4. static class Entry extends WeakReference<ThreadLocal> {
  5. /** The value associated with this ThreadLocal. */
  6. Object value;
  7. Entry(ThreadLocal k, Object v) {
  8. super(k);
  9. value = v;
  10. }
  11. }
  12. // ...其他方法
  13. }
  14. // ...其他方法
  15. }

从上面代码中可以看出Entry的key就是ThreadLocal,而value就是值。同时,Entry也继承WeakReference,所以说Entry所对应key(ThreadLocal实例)的引用为一个弱引用(关于弱引用这里就不多说了,感兴趣的可以关注这篇博客:Java 理论与实践: 用弱引用堵住内存泄漏)。

ThreadLocalMap的源码稍微多了点,我们就看两个最核心的方法getEntry()、set(ThreadLocal> key, Object value)方法。

3.1.1、getEntry()

  1. private Entry getEntry(ThreadLocal key) {
  2. int i = key.threadLocalHashCode & (table.length - 1);
  3. Entry e = table[i];
  4. if (e != null && e.get() == key)
  5. return e;
  6. else
  7. return getEntryAfterMiss(key, i, e);
  8. }

由于采用了开放定址法,所以当前key的散列值和元素在数组的索引并不是完全对应的,首先取一个探测数(key的散列值),如果所对应的key就是我们所要找的元素,则返回,否则调用getEntryAfterMiss(),如下:

  1. private Entry getEntryAfterMiss(ThreadLocal key, int i, Entry e) {
  2. Entry[] tab = table;
  3. int len = tab.length;
  4. while (e != null) {
  5. ThreadLocal k = e.get();
  6. if (k == key)
  7. return e;
  8. if (k == null)
  9. expungeStaleEntry(i);
  10. else
  11. i = nextIndex(i, len);
  12. e = tab[i];
  13. }
  14. return null;
  15. }

这里有一个重要的地方,当key == null时,调用了expungeStaleEntry()方法,该方法用于处理key == null,有利于GC回收,能够有效地避免内存泄漏。

3.1.2、set(ThreadLocal> key, Object value)

  1. private void set(ThreadLocal<?> key, Object value) {
  2. ThreadLocal.ThreadLocalMap.Entry[] tab = table;
  3. int len = tab.length;
  4. // 根据 ThreadLocal 的散列值,查找对应元素在数组中的位置
  5. int i = key.threadLocalHashCode & (len - 1);
  6. // 采用“线性探测法”,寻找合适位置
  7. for (ThreadLocal.ThreadLocalMap.Entry e = tab[i]; e != null; e = tab[i = nextIndex(i, len)]) {
  8. ThreadLocal<?> k = e.get();
  9. // key 存在,直接覆盖
  10. if (k == key) {
  11. e.value = value;
  12. return;
  13. }
  14. // key == null,但是存在值(因为此处的e != null),说明之前的ThreadLocal对象已经被回收了
  15. if (k == null) {
  16. // 用新元素替换陈旧的元素
  17. replaceStaleEntry(key, value, i);
  18. return;
  19. }
  20. }
  21. // ThreadLocal对应的key实例不存在也没有陈旧元素,new 一个
  22. tab[i] = new ThreadLocal.ThreadLocalMap.Entry(key, value);
  23. int sz = ++size;
  24. // cleanSomeSlots 清除陈旧的Entry(key == null)
  25. // 如果没有清理陈旧的 Entry 并且数组中的元素大于了阈值,则进行 rehash
  26. if (!cleanSomeSlots(i, sz) && sz >= threshold)
  27. rehash();
  28. }

这个set()操作和我们在集合了解的put()方式有点儿不一样,虽然他们都是key-value结构,不同在于他们解决散列冲突的方式不同。集合Map的put()采用的是拉链法,而ThreadLocalMap的set()则是采用开放定址法(具体请参考散列冲突处理系列博客)。掌握了开放地址法该方法就一目了然了。

set()操作除了存储元素外,还有一个很重要的作用,就是replaceStaleEntry()和cleanSomeSlots(),这两个方法可以清除掉key == null 的实例,防止内存泄漏。在set()方法中还有一个变量很重要:threadLocalHashCode,定义如下:

  1. private final int threadLocalHashCode = nextHashCode();

从名字上面我们可以看出threadLocalHashCode应该是ThreadLocal的散列值,定义为final,表示ThreadLocal一旦创建其散列值就已经确定了,生成过程则是调用nextHashCode():

  1. private static AtomicInteger nextHashCode = new AtomicInteger();
  2. private static final int HASH_INCREMENT = 0x61c88647;
  3. private static int nextHashCode() {
  4. return nextHashCode.getAndAdd(HASH_INCREMENT);
  5. }

nextHashCode表示分配下一个ThreadLocal实例的threadLocalHashCode的值,HASH_INCREMENT则表示分配两个ThradLocal实例的threadLocalHashCode的增量,从nextHashCode就可以看出他们的定义。

上面的两个方法都是静态内部类ThreadLocalMap中的方法,下面让我们看看ThreadLocal中的其他方法。

3.2、get()

返回此线程局部变量的当前线程副本中的值。

  1. public T get() {
  2. // 获取当前线程
  3. Thread t = Thread.currentThread();
  4. // 获取当前线程的成员变量 threadLocal
  5. ThreadLocalMap map = getMap(t);
  6. if (map != null) {
  7. // 从当前线程的ThreadLocalMap获取相对应的Entry
  8. ThreadLocalMap.Entry e = map.getEntry(this);
  9. if (e != null) {
  10. @SuppressWarnings("unchecked")
  11. // 获取目标值
  12. T result = (T)e.value;
  13. return result;
  14. }
  15. }
  16. return setInitialValue();
  17. }

首先通过当前线程获取所对应的成员变量ThreadLocalMap,然后通过ThreadLocalMap获取当前ThreadLocal的Entry,最后通过所获取的Entry获取目标值result。

getMap()方法可以获取当前线程所对应的ThreadLocalMap,如下:

  1. ThreadLocalMap getMap(Thread t) {
  2. return t.threadLocals;
  3. }

3.3、set(T value)

将此线程局部变量的当前线程副本中的值设置为指定值。

  1. public void set(T value) {
  2. Thread t = Thread.currentThread(); // 获取当前线程
  3. ThreadLocalMap map = getMap(t); // 获取当前线程所对应的ThreadLocalMap
  4. if (map != null)
  5. map.set(this, value); // ThreadLocalMap不为空时,调用ThreadLocalMap的set()方法
  6. else
  7. createMap(t, value); // ThreadLocalMap为空时,调用createMap()方法新建一个ThreadLocalMap
  8. }

首先获取当前线程所对应的ThreadLocalMap,如果不为空,则调用ThreadLocalMap的set()方法,key就是当前ThreadLocal;如果不存在,则调用createMap()方法新建一个ThreadLocalMap,key为当前线程,值为指定的value。如下:

  1. void createMap(Thread t, T firstValue) {
  2. t.threadLocals = new ThreadLocalMap(this, firstValue);
  3. }

3.4、initialValue()

返回此线程局部变量的当前线程的“初始值”;

  1. protected T initialValue() {
  2. return null;
  3. }

该方法定义为protected级别且返回为null,很明显是要子类实现它的,所以我们在使用ThreadLocal的时候一般都应该覆盖该方法。该方法不能显示调用,只有在第一次调用get()或者set()方法时才会被执行,并且仅执行1次。

3.5、remove()

将当前线程局部变量的值移除。

  1. public void remove() {
  2. // 获取当前线程的ThreadLocalMap
  3. ThreadLocalMap m = getMap(Thread.currentThread());
  4. if (m != null)
  5. m.remove(this); // 如果当前线程的ThreadLocalMap不为空,则移除
  6. }

4、ThreadLocal为什么会内存泄漏

先看这样一个小案例:

在JAVA里面,存在强引用、弱引用、软引用、虚引用。这里主要谈一下强引用和弱引用。

  • 强引用类似于:

A a = new A();

B b = new B();

  • 现在考虑这种情况:

C c = new C(b);

b = null;

考虑下GC的情况。要知道b被置为null,那么是否意味着一段时间后GC工作可以回收b所分配的内存空间呢?

答案是否定的,因为即便b被置为null,但是c仍然持有对b的引用,而且还是强引用,所以GC不会回收b原先所分配的空间!既不能回收利用,又不能使用,这就造成了内存泄露

那么如何处理呢?

可以使c = null;也可以使用弱引用!(WeakReference w = new WeakReference(b);)

下面就来看看ThreadLocal的内存泄露是怎么一回事:

前面提到每个Thread都有一个ThreadLocal.ThreadLocalMap的map,该map的key为ThreadLocal实例,它为一个弱引用,我们知道弱引用有利于GC回收。当ThreadLocal的key == null时,GC就会回收这部分空间,但是value却不一定能够被回收,因为他还与Current Thread存在一个强引用关系,如下图所示:

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3Bjd2wxMjA2_size_16_color_FFFFFF_t_70 2

由于存在这个强引用关系,会导致value无法回收。如果这个线程对象不会销毁,那么这个强引用关系则会一直存在,就会出现内存泄漏情况。所以说只要这个线程对象能够及时被GC回收,就不会出现内存泄漏。如果碰到线程池,那就更坑了。

那么要怎么避免这个问题呢?

在前面提过,在ThreadLocalMap中的setEntry()、getEntry(),如果遇到key == null的情况,会对value设置为null。当然我们也可以显示调用ThreadLocal的remove()方法进行处理


5、总结

下面对ThreadLocal进行简单的总结:

1、ThreadLocal 不是用于解决共享变量的问题的,也不是为了协调线程同步而存在,而是为了方便每个线程处理自己的状态而引入的一个机制。这点至关重要;

2、每个Thread内部都有一个ThreadLocal.ThreadLocalMap类型的成员变量,该成员变量用来存储实际的ThreadLocal变量副本;

3、ThreadLocal并不是为线程保存对象的副本,它仅仅只起到一个索引的作用。它的主要目的是为每一个线程隔离一个类的实例,这个实例的作用范围仅限于线程内部。

本文转发自:http://cmsblogs.com/?p=2442

上一篇:synchronized关键字:https://blog.csdn.net/pcwl1206/article/details/84849400

发表评论

表情:
评论列表 (有 0 条评论,325人围观)

还没有评论,来说两句吧...

相关阅读