• 线程 、进程、协程 三者区别


    从计算机硬件角度:

    计算机的核心是CPU,承担了所有的计算任务。
    一个CPU,在一个时间切片里只能运行一个程序。

    从操作系统的角度:

    进程和线程,都是一种CPU的执行单元。

    进程:表示一个程序的上下文执行活动(打开、执行、保存...)

    线程:进程执行程序时候的最小调度单位(执行a,执行b...)

    一个程序至少有一个进程,一个进程至少有一个线程。

    并行 和 并发:


    并行:多个CPU核心,不同的程序就分配给不同的CPU来运行。可以让多个程序同时执行。

    cpu1 -------------
    cpu2 -------------
    cpu3 -------------
    cpu4 -------------

    并发:单个CPU核心,在一个时间切片里一次只能运行一个程序,如果需要运行多个程序,则串行执行。

    cpu1  ----  ----

    cpu1    ----  ----


    多进程/多线程:
    表示可以同时执行多个任务,进程和线程的调度是由操作系统自动完成。


    进程:每个进程都有自己独立的内存空间,不同进程之间的内存空间不共享。
    进程之间的通信有操作系统传递,导致通讯效率低,切换开销大。

    线程:一个进程可以有多个线程,所有线程共享进程的内存空间,通讯效率高,切换开销小。

    共享意味着竞争,导致数据不安全,为了保护内存空间的数据安全,引入"互斥锁"。

    一个线程在访问内存空间的时候,其他线程不允许访问,必须等待之前的线程访问结束,才能使用这个内存空间。

    互斥锁:一种安全有序的让多个线程访问内存空间的机制。

    Python的多线程:

    GIL 全局解释器锁:线程的执行权限,在Python的进程里只有一个GIL。

    一个线程需要执行任务,必须获取GIL。

    好处:直接杜绝了多个线程访问内存空间的安全问题。
    坏处:Python的多线程不是真正多线程,不能充分利用多核CPU的资源。

    但是,在I/O阻塞的时候,解释器会释放GIL。


    所以:

    多进程:密集CPU任务,需要充分使用多核CPU资源(服务器,大量的并行计算)的时候,用多进程。 multiprocessing
    缺陷:多个进程之间通信成本高,切换开销大。


    多线程:密集I/O任务(网络I/O,磁盘I/O,数据库I/O)使用多线程合适。
    threading.Thread、multiprocessing.dummy
    缺陷:同一个时间切片只能运行一个线程,不能做到高并行,但是可以做到高并发。


    协程:又称微线程,在单线程上执行多个任务,用函数切换,开销极小。不通过操作系统调度,没有进程、线程的切换开销。genvent,monkey.patchall

    多线程请求返回是无序的,那个线程有数据返回就处理那个线程,而协程返回的数据是有序的。

    缺陷:单线程执行,处理密集CPU和本地磁盘IO的时候,性能较低。处理网络I/O性能还是比较高.

    1. 进程: 通俗理解一个运行起来的程序或者软件叫做进程
    1.1 每次启动一个进程都需要向操作系统索要运行资源,让进程中的线程去执行对应的代码,进程是操作系统分配资源的基本单位
    1.2 默认情况下一个进程只有一个线程,线程是依附在进程里面的, 没有进程就没有线程, 当在进程里面还可以创建多个线程
    1.3 如何理解进程: 把进程想成现实生活中的公司,公司可以给员工提供办公资源(办公桌椅,办公电脑等资源), 真正干活的是员工,所以员工可以想成线程,公司就是进程
    2. 进程和线程的对比
    2.1 进程是操作系统资源分配的基本单位,每启动一个进程都需要向操作系统索要运行资源,默认一个进程只有一个线程,线程是依附在进程里面的
    2.2 线程是cpu调度的基本单位, 通过线程去执行进程中代码, 线程是执行代码的分支
    2.3 多进程开发比单进程多线程开发稳定性要强,但是多进程开发比多线程开发资源开销要大
    2.4 多进程开发某个进程死了不会影响其它进程的运行,但是多线程开发该进程死了那么这些线程都要进行销毁

    并发: 任务数大于cpu的核数,多个任务轮流执行,由于cpu切换速度特别快,看起来像是一起运行,其实是假象。

    并行:  任务数小于或者等于cpu的核数,那么多个任务是真正意义一起执行。

    3. 进程、线程、协程
    1.1 先有进程,然后进程可以创建线程,线程是依附在进程里面的, 线程里面可以包含多个协程
    1.2 进程之间不共享全局变量,线程之间共享全局变量,但是要注意资源竞争的问题
    1.3 多进程开发比单进程多线程开发稳定性要强,但是多进程开发比多线程开发资源开销要大
    1.4 多线程开发线程之间执行是无序的,协程之间执行按照一定顺序交替执行
    1.5 协程以后主要用在网络爬虫和网络请求,开辟一个协程大概需要5k空间,开辟一个线程需要512k空间, 开辟一个进程占用资源最多

  • 相关阅读:
    JAVA-容器(5)-Map
    JAVA-容器(4)-Set
    数据脏读-非重复读-幻读
    JAVA-容器(3)-List
    JAVA-容器(2)-Collection
    JAVA-容器(1)
    Arrays排序
    JAVA-虚拟机(3)-调优
    zip解压缩
    rabbitMQ、activeMQ、zeroMQ、Kafka、Redis 比较
  • 原文地址:https://www.cnblogs.com/ellisonzhang/p/10470760.html
Copyright © 2020-2023  润新知