导语
我们知道,new一个thread,调用它的start的方法,就可以创建一个线程,并且启动该线程,然后执行该线程需要执行的业务逻辑,
那么run方法是怎么被执行的呢?
Java线程和os线程
os线程
我们知道,java的一个线程实际上是对应了操作系统的一个线程;
而操作系统实现线程有三种方式:
- 内核线程实现
- 用户线程实现
- 用户线程加轻量级进程混合实现
内核线程实现
简要说明:
内核线程(Kernel-Level Thread简称KLT)是直接由操作系统内核直接支持的线程,这种线程由内核完成线程切换,内核通过操纵调度器对线程进行调度,
并负责将线程的任务映射到各个处理器上。
每个内核线程可以视为内核的一个分身,这样操作系统就有能力处理多件事情,这种支持多线程的内核就叫做多线程内核;
程序一般不会直接操作内核线程,而是去使用内核线程的一种高级接口:轻量级进程(Light Weight Process,简称LWP),轻量级进程就是我们通常所讲的
线程,每个轻量级进程都由一个内核线程支持,这种轻量级进程与内核线程1:1的关系称为一对一的线程模型。
优势:由于有了内核线程的支持,每个轻量级进程都称为一个独立的调度单元,即使有一个轻量级进程在系统中阻塞了,也不会影响整个进程继续工作;
劣势:
- 由于基于内核线程实现,所以各种线程操作(创建,析构及同步等)都需要进行系统调用(系统调用代价相对较高,需要在用户态[User Mode]和内核态[Kernel Mode]来回切换);
- 每个轻量级进程需要一个内核线程支持,因此需要消耗一定的内核资源(如内核线程的栈空间),因此一个系统支持轻量级进程的数量是有限的;
用户线程实现
简要说明:
用户线程:
- 广义上来讲,任何非内核线程都可以认为是用户线程(User Thread,简称UT);
- 狭义上来讲,完全建立在用户空间的线程库上,系统内核不能感知线程存在的实现;
特点:
- 用户线程的创建、同步、销毁和调度完全在用户态中完成,不需要内核的帮助,这种线程不需要切换到内核态,操作可以非常快速且低消耗;
- 支持更大的线程数量;
- 这种进程与用户线程之间1:N的关系称为一对多的线程模型;
用户线程的优势就是不需要系统内核支援,劣势就是没有内核支持,所有的线程操作(如线程的创建、切换和调度等)都需要用户程序自己处理。
用户线程加轻量级进程混合实现
简要说明:
用户线程+轻量级进程特点:
- 用户线程的创建、析构、切换等操作很廉价;
- 支持大规模的用户线程并发;
- 操作系统提供的轻量级进程作为用户线程和内核线程之间的桥梁,提供线程调度功能及处理器映射;
- 用户线程的系统调用通过轻量级进程完成,降低了整个进程完全被阻塞的风险;
- 这种用户线程和轻量级进程的数量比不定,即N:M的关系,称为多对多的线程模型
Java线程
Java线程在JDK1.2之前,是基于用户线程实现的。而在JDK1.2中,线程模型替换为基于操作系统原生线程模型来实现。
而在目前的JDK版本中,操作系统支持怎样的线程模型,在很大程度上决定了Java虚拟机的线程是怎样映射的,这点在不同的平台上没法达成一致。
对于Sun JDK来说,它的Windows版本和Linux版本都是使用一对一的线程模型实现的,一条Java线程映射到一条轻量级进程之中。
Java线程创建
创建方式
Desc:我们看到,无论以哪种方式创建,最终我们都会重写一个叫做 run 的方法,来处理我们的业务逻辑,然而我们都是调用一个start方法,来启动一个线程;
那 start方法和run方法之间是一个什么关系呢?从后边的介绍我们将获得这样一个信息:run就是一个回调函数,和我们普通的函数没有区别。
Java线程的实现
一个 Java 线程的创建本质上就对应了一个本地线程(native thread)的创建,两者是一一对应的。
关键问题是:本地线程执行的应该是本地代码,而 Java 线程提供的线程函数(run)是 Java 方法,编译出的是 Java 字节码,
所以, Java 线程其实提供了一个统一的线程函数,该线程函数通过 Java 虚拟机调用 Java 线程方法 , 这是通过 Java 本地方法调用来实现的。
以下是 Thread#start 方法的示例:
可以看到它实际上调用了本地方法 start0, 而start0声明如下:
private native void start0();
也就是新创建的线程启动调用native start0方法,而这些native方法的注册是在Thread对象初始化的时候完成的,look:
Thread 类有个 registerNatives 本地方法,该方法主要的作用就是注册一些本地方法供 Thread 类使用,如 start0(),stop0() 等等,可以说,所有操作本地线程的本地方法都是由它注册的。
这个方法放在一个 static 语句块中,当该类被加载到 JVM 中的时候,它就会被调用,进而注册相应的本地方法。
而本地方法 registerNatives 是定义在 Thread.c 文件中的。Thread.c 是个很小的文件,它定义了各个操作系统平台都要用到的关于线程的公用数据和操作,如下:
1 JNIEXPORT void JNICALL 2 Java_Java_lang_Thread_registerNatives (JNIEnv *env, jclass cls){ //registerNatives 3 (*env)->RegisterNatives(env, cls, methods, ARRAY_LENGTH(methods)); 4 } 5 static JNINativeMethod methods[] = { 6 {"start0", "()V",(void *)&JVM_StartThread}, //start0 方法 7 {"stop0", "(" OBJ ")V", (void *)&JVM_StopThread}, 8 {"isAlive","()Z",(void *)&JVM_IsThreadAlive}, 9 {"suspend0","()V",(void *)&JVM_SuspendThread}, 10 {"resume0","()V",(void *)&JVM_ResumeThread}, 11 {"setPriority0","(I)V",(void *)&JVM_SetThreadPriority}, 12 {"yield", "()V",(void *)&JVM_Yield}, 13 {"sleep","(J)V",(void *)&JVM_Sleep}, 14 {"currentThread","()" THD,(void *)&JVM_CurrentThread}, 15 {"countStackFrames","()I",(void *)&JVM_CountStackFrames}, 16 {"interrupt0","()V",(void *)&JVM_Interrupt}, 17 {"isInterrupted","(Z)Z",(void *)&JVM_IsInterrupted}, 18 {"holdsLock","(" OBJ ")Z",(void *)&JVM_HoldsLock}, 19 {"getThreads","()[" THD,(void *)&JVM_GetAllThreads}, 20 {"dumpThreads","([" THD ")[[" STE, (void *)&JVM_DumpThreads}, 21 };
观察上边一小段代码,可以容易的看出 Java 线程调用 start->start0 的方法,实际上会调用到 JVM_StartThread 方法,那这个方法又是怎么处理的呢?
实际上,我们需要看到的是该方法最终要调用 Java 线程的 run 方法,事实的确也是这样的。
在 jvm.cpp 中,有如下代码段:
JVM_ENTRY(void, JVM_StartThread(JNIEnv* env, jobject jthread)){ ... native_thread = new JavaThread(&thread_entry, sz); ... }
static void thread_entry(JavaThread* thread, TRAPS) { HandleMark hm(THREAD); Handle obj(THREAD, thread->threadObj()); JavaValue result(T_VOID); JavaCalls::call_virtual(&result,obj, KlassHandle(THREAD,SystemDictionary::Thread_klass()), vmSymbolHandles::run_method_name(), //LOOK! 看这里 vmSymbolHandles::void_method_signature(),THREAD); }
可以看到调用了 vmSymbolHandles::run_method_name 方法,而run_method_name是在 vmSymbols.hpp 用宏定义的:
class vmSymbolHandles: AllStatic { ... template(run_method_name,"run") //LOOK!!! 这里决定了调用的方法名称是 “run”! ... }