进程是操作系统分配资源(CPU时间、内存)的基本单位,线程是调度执行的基本单元。一个线程必定属于一个进程,一个进程可包含多个线程。
nginx、redis是常见的多进程模型,Tomcat、memcached是多线程模型。
- 多进程数据共享复杂,需要用管道,信号,消息队列,共享内存,套接字等通信机制,但数据同步简单,而多线程共享进程数据段,数据共享简单,但同步复杂。
- 多进程占用内存多、创建、销毁切换复杂,CPU利用率低,而多线程占用内存小,创建销毁、切换简单、速度快。
- 多进程编程调试简单、进程间不会互相影响,适用于多核多机分布式,扩展到多台机器时简单,而多线程编程调试复杂,一个线程挂掉可能影响整个进程,适用于多核分布式。
需要频繁创建销毁、需要大量计算、切换频繁、多核分布时优先使用线程,需要更稳定安全、支持多机分布时适合选择进程。
对比维度 |
多进程 |
多线程 |
总结 |
数据共享、同步 |
数据共享复杂,需要用IPC;数据是分开的,同步简单 |
因为共享进程数据,数据共享简单,但也是因为这个原因导致同步复杂 |
各有优势 |
内存、CPU |
占用内存多,切换复杂,CPU利用率低 |
占用内存少,切换简单,CPU利用率高 |
线程占优 |
创建销毁、切换 |
创建销毁、切换复杂,速度慢 |
创建销毁、切换简单,速度很快 |
线程占优 |
编程、调试 |
编程简单,调试简单 |
编程复杂,调试复杂 |
进程占优 |
可靠性 |
进程间不会互相影响 |
一个线程挂掉将导致整个进程挂掉 |
进程占优 |
分布式 |
适应于多核、多机分布式;如果一台机器不够,扩展到多台机器比较简单 |
适应于多核分布式 |
进程占优 |