线程有时被称为轻量级进程(Lightweight Process, LWP), 是程序执行流的最小单元。一个标准的线程由线程ID,程序计数器(Process Counter),寄存器集合和堆栈(stack)组成。通常意义上,一个进程由一个或多个线程组成,各个线程之间共享程序的内存空间(包括代码段、数据段、堆等)以及一些进程级的资源(如打开文件和信号)。另外,线程是进程中的一个实体,被系统调度和分派的基本单位,线程自己不拥有系统资源,只拥有一点在运行中必不可少的资源,但它可与同属一个进程的其他线程共享所拥有的资源。
线程之间私有与共有之间
线程私有 | 线程之间共有 |
1. 局部变量 2. 函数的参数 3. TLS数据 4. 程序计数器 5. 寄存器 6. 堆栈 7. 状态 |
1. 全部变量 2. 堆上的数据 3. 函数里的静态变量 4. 程序代码,任何线程都有权利读取并执行任何代码 5. 打开的文件,A线程打开的文件可以由B线程读写 6. 地址空间 7.子进程 |
由于各个线程都可以访问进程地址空间中的每一个内存地址,所以一个线程可以读、写甚至清除另一个线程的堆栈。同样地,如果一个线程打开了一个文件,该文件对该进程中的其他线程都可见。线程之间是没有保护的。
线程的状态:
线程也有就绪、阻塞和运行三种状态。每一个程序都至少有一个线程,若程序只有一个线程,那就是程序本身。
线程是程序中一个单一的顺序控制流程。在单个程序中同时运行多个线程完成不同的工作,称为多线程。
引入线程后,进程的内涵发生变化,进程只作为除CPU之外以系统资源的分配单元,线程则作为处理器的分配单元。在同一个进程中,线程的切换不会引起进程的切换,但从一个进程中的线程切换到另一个进程中的线程时,将会引起进程的切换。
进程和线程的区别:
1.调度:在传统操作系统中,拥有资源和独立调度的基本单位都是进程。引入线程后,线程是独立调度的基本单位,进程是拥有资源的基本单位。在同一进程中,线程的切换不会引起进程切换。在不同的进程中进程的切换,则会引起线程的切换。
2. 系统开销:创建和撤销进程时,系统都要为之分配或回收资源,如内存空间,I/O设备等,因此操作系统所付出的开销远大于创建或撤销线程的开销。类似地,在进程切换时,涉及当前执行进程CPU环境的保存以及新调度的进程CPU环境的设置;而进程切换时只需保存和设置少量寄存器内容,因此开销很小。另外,由于同一进程内的多个线程共享进程的地址空间,因此这些线程之间的同步与通信比较容易实现,甚至无须操作系统的干预。
3. 地址空间和其他资源(如打开的文件):进程的地址空间之间相互独立,同一进程的各线程间共享进程的资源,某进程内的线程对于其他进程不可见。
4. 进程通信:进程间通信需要借助操作系统,而线程间通信可以直接读/写数据进程段(如全局变量)来进程通信。
Linux线程
在传统的Unix系统中,每个进程包含一个线程。在现代操作系统中,多线程系统则比较常见。Linux并不区分进程与线程。对于Linux来说,线程只是一种特殊的进程。
参考资料:
1.《现代操作系统》(原书第三版) 机械工业出版社
2.《深入理解计算机系统》(原书第二版) 机械工业出版社
3. 《Linux内核设计与实现》(英文版 第3版) 机械工业出版社
4. 《程序员的自我修养》--链接、装载与库 电子工业出版社