前言
学习 ThreadLocalRandom
的时候遇到一些疑惑,为何使用它在多线程下会产生相同的随机数?
阅读源码后终于稍微了解了一些它的运行机制,总结出它在多线程下正确的用法,特此记录。
ThreadLocalRandom的用处
在多线程下,使用 java.util.Random
产生的实例来产生随机数是线程安全的,但深挖 Random
的实现过程,会发现多个线程会竞争同一 seed
而造成性能降低。
其原因在于:
Random
生成新的随机数需要两步:
-
根据老的
seed
生成新的seed
-
由新的
seed
计算出新的随机数
其中,第二步的算法是固定的,如果每个线程并发地获取同样的 seed
,那么得到的随机数也是一样的。为了避免这种情况,Random
使用 CAS 操作保证每次只有一个线程可以获取并更新 seed,失败的线程则需要自旋重试。
因此,在多线程下用 Random
不太合适,为了解决这个问题,出现了 ThreadLocalRandom
,在多线程下,它为每个线程维护一个 seed
变量,这样就不用竞争了。
但是我在使用的时候,发现 ThreadLocalRandom
在多线程下产生了相同的随机数,这是怎么回事呢?
ThreadLocalRandom多线程下产生相同随机数
来看一下产生相同随机数的示例代码:
1 import java.util.concurrent.ThreadLocalRandom;
2
3 public class ThreadLocalRandomDemo {
4
5 private static final ThreadLocalRandom RANDOM =
6 ThreadLocalRandom.current();
7
8 public static void main(String[] args) {
9 for (int i = 0; i < 10; i++) {
10 new Player().start();
11 }
12 }
13
14 private static class Player extends Thread {
15 @Override
16 public void run() {
17 System.out.println(getName() + ": " + RANDOM.nextInt(100));
18 }
19 }
20 }
运行该代码,结果如下:
1 Thread-0: 4
2 Thread-1: 4
3 Thread-2: 4
4 Thread-3: 4
5 Thread-4: 4
6 Thread-5: 4
7 Thread-6: 4
8 Thread-7: 4
9 Thread-8: 4
10 Thread-9: 4
为此,我阅读了 ThreadLocalRandom
的源码,从中找到了端倪。
先是静态 current() 方法:
1 public static ThreadLocalRandom current() {
2 //如果线程第一次调用 current() 方法,执行 localInit()方法
3 if (UNSAFE.getInt(Thread.currentThread(), PROBE) == 0)
4 localInit();
5 return instance;
6 }
初始化方法 localInit()
中,为线程初始化了 seed
,并保存在 UNSAFE
里,这里 UNSAFE
的方法是 native
方法,我不太了解,但并不影响理解。可以把这里的操作看作是初始化了 seed
,把线程和 seed
以键值对的形式保存起来。
1 static final void localInit() {
2 int p = probeGenerator.addAndGet(PROBE_INCREMENT);
3 int probe = (p == 0) ? 1 : p; // skip 0
4 long seed = mix64(seeder.getAndAdd(SEEDER_INCREMENT));
5 Thread t = Thread.currentThread();
6 UNSAFE.putLong(t, SEED, seed);
7 UNSAFE.putInt(t, PROBE, probe);
8 }
当要生成随机数的时候,调用 nextInt()
方法:
1 public int nextInt(int bound) {
2 if (bound <= 0)
3 throw new IllegalArgumentException(BadBound);
4 //第一处
5 int r = mix32(nextSeed());
6 int m = bound - 1;
7 if ((bound & m) == 0) // power of two
8 r &= m;
9 else { // reject over-represented candidates
10 for (int u = r >>> 1;
11 u + m - (r = u % bound) < 0;
12 u = mix32(nextSeed()) >>> 1)
13 ;
14 }
15 return r;
16 }
这里主要关注 第一处
的 nextSeed()
方法:
1 final long nextSeed() {
2 Thread t; long r; // read and update per-thread seed
3 UNSAFE.putLong(t = Thread.currentThread(), SEED,
4 r = UNSAFE.getLong(t, SEED) + GAMMA);
5 return r;
6 }
好了,问题来了!这里返回的值是 r = UNSAFE.getLong(t, SEED) + GAMMA
,是从 UNSAFE
里取出来的。但问题是,这里取出来的值对不对?或者说,能否取出来?
回到示例代码,我们在主线程调用了 TreadLocalRandom
的 current()
方法,该方法把主线程和主线程的 seed
存入了 UNSAFE
。
接下来,我们在非主线程调用 nextInt()
,但非主线程和 seed
的键值对之前并没有存入 UNSAFE
。但我们却从 UNSAFE
里取非主线程的 seed
值,虽然我不知道取出来的 seed
到底是什么,但肯定不是多线程下想要的结果,而这也导致了多线程下产生的随机数是重复的。
那么在多线程下如何正确地使用 ThreadLocalRandom
呢?
ThreadLocalRandom多线程下正确用法
结合上述分析,正确地使用 ThreadLocalRandom
,肯定需要给每个线程初始化一个 seed
,那就需要调用 ThreadLocalRandom.current()
方法。
那么有个疑问,在每个线程里都调用 ThreadLocalRandom.current()
,会产生多个 ThreadLocalRandom
实例吗?
不会的,见源码:
1 /** The common ThreadLocalRandom */
2 static final ThreadLocalRandom instance = new ThreadLocalRandom();
3
4 /**
5 * Returns the current thread's {@code ThreadLocalRandom}.
6 *
7 * @return the current thread's {@code ThreadLocalRandom}
8 */
9 public static ThreadLocalRandom current() {
10 if (UNSAFE.getInt(Thread.currentThread(), PROBE) == 0)
11 localInit();
12 return instance;
13 }
放心大胆地使用。
于是示例代码改动如下:
1 import java.util.concurrent.ThreadLocalRandom;
2
3 public class ThreadLocalRandomDemo {
4
5 public static void main(String[] args) {
6 for (int i = 0; i < 10; i++) {
7 new Player().start();
8 }
9 }
10
11 private static class Player extends Thread {
12 @Override
13 public void run() {
14 System.out.println(getName() + ": " + ThreadLocalRandom.current().nextInt(100));
15 }
16 }
17 }
运行一下,可以得到想要的结果:
1 Thread-0: 90
2 Thread-3: 77
3 Thread-2: 97
4 Thread-5: 96
5 Thread-4: 42
6 Thread-1: 3
7 Thread-6: 4
8 Thread-7: 6
9 Thread-8: 52
10 Thread-9: 39
总结一下,在多线程下使用 ThreadLocalRandom
产生随机数时,直接使用 ThreadLocalRandom.current().xxxx
还有一点需要强调的是,ThreadLocalRandom在高并发下的性能远远超过Random,作为服务端开发,这个性能需要考虑,下面我们做一个测试,代码如下:
1 public class RandomTest {
2 private static Random random = new Random();
3
4 private static final int N = 100000;
5 // Random from java.util.concurrent.
6 private static class TLRandom implements Runnable {
7 @Override
8 public void run() {
9 double x = 0;
10 for (int i = 0; i < N; i++) {
11 x += ThreadLocalRandom.current().nextDouble();
12 }
13 }
14 }
15
16 // Random from java.util
17 private static class URandom implements Runnable {
18 @Override
19 public void run() {
20 double x = 0;
21 for (int i = 0; i < N; i++) {
22 x += random.nextDouble();
23 }
24 }
25 }
26
27 public static void main(String[] args) {
28 System.out.println("threadNum,Random,ThreadLocalRandom");
29 for (int threadNum = 50; threadNum <= 2000; threadNum += 50) {
30 ExecutorService poolR = Executors.newFixedThreadPool(threadNum);
31 long RStartTime = System.currentTimeMillis();
32 for (int i = 0; i < threadNum; i++) {
33 poolR.execute(new URandom());
34 }
35 try {
36 poolR.shutdown();
37 poolR.awaitTermination(100, TimeUnit.SECONDS);
38 } catch (InterruptedException e) {
39 e.printStackTrace();
40 }
41 String str = "" + threadNum +"," + (System.currentTimeMillis() - RStartTime)+",";
42
43 ExecutorService poolTLR = Executors.newFixedThreadPool(threadNum);
44 long TLRStartTime = System.currentTimeMillis();
45 for (int i = 0; i < threadNum; i++) {
46 poolTLR.execute(new TLRandom());
47 }
48 try {
49 poolTLR.shutdown();
50 poolTLR.awaitTermination(100, TimeUnit.SECONDS);
51 } catch (InterruptedException e) {
52 e.printStackTrace();
53 }
54 System.out.println(str + (System.currentTimeMillis() - TLRStartTime));
55 }
56 }
57 }
输出结果如下:
1 ThreadNum,Random,ThreadLocalRandom
2 50,1192,575
3 100,4031,162
4 150,6068,223
5 200,8093,287
6 250,10049,248
7 300,12346,200
8 350,14429,212
9 400,16491,62
10 450,18475,96
11 500,11311,97
12 550,12421,90
13 600,13577,102
14 650,14718,111
15 700,15896,127
16 750,17101,129
17 800,17907,203
18 850,19261,226
19 900,21576,151
20 950,22206,147
21 1000,23418,174
起始ThreadLocalRandom是对每个线程都设置了单独的随机数种子,这样就不会发生多线程同时更新一个数时产生的资源争抢了,用空间换时间。