• Python 基础知识点理解(三)之Python多进程和多线程的区别和联系


    先说一下什么是进程,线程

      进程:进程时计算机程序一次执行的实例,由 程序段 数据段 PCB组成,是计算机资源分配和调度的基本单位,也是线程的容器

      线程:线程也叫作轻量级进程,是程序执行的最小单位,他本身只拥有少部分执行必须的资源。

      

      进程和线程的VS(创建,通信,稳定性): 

        (1)线程共享内存空间;进程的内存是独立的

        (2)同一个进程的线程之间可以直接交流;两个进程想通信,必须通过一个中间代理来实现

        (3)创建新线程很简单; 创建新进程需要对其父进程进行一次克隆

        (4)一个线程可以控制和操作同一进程里的其他线程;但是进程只能操作子进程

        (5)改变主线程(如优先权),可能会影响其它线程;多进程的稳定性好,改变父进程,不影响子进程

    多进程和多线程:

    因为GIL的问题导致系统中同一时间点只能有一个线程被解释器解释,这就导致了线程无法实现并行,无法充分的利用我们计算机的多核资源,python所谓的多线程编程就类似于单核CPU情况下的多进程编程。

    相比之下多进程下每个进程执行的时候都会创建一个解释器,所以就能够比较好的计算机的多和资源实现并行。

    那么,我们改如何解决GIL锁的问题呢?

      1.更换cpython为jpython(不建议)

      2.使用多进程完成多线程的任务

      3.在使用多线程可以使用c语言去实现

    问题1: 什么时候会释放Gil锁,
      1 遇到像 i/o操作这种 会有时间空闲情况 造成cpu闲置的情况会释放Gil
      2 会有一个专门ticks进行计数 一旦ticks数值达到100 这个时候释放Gil锁 线程之间开始竞争Gil锁(说明:
          ticks这个数值可以进行设置来延长或者缩减获得Gil锁的线程使用cpu的时间)

    问题2: 互斥锁和Gil锁的关系
    Gil锁  : 保证同一时刻只有一个线程能使用到cpu
    互斥锁 : 多线程时,保证修改共享数据时有序的修改,不会产生数据修改混乱

    https://www.cnblogs.com/shunge/p/8120047.html

    https://blog.csdn.net/IAlexanderI/article/details/70168318

    http://python.jobbole.com/85231/

    协程

    协程又叫微线程,简单点说协程是进程和线程的升级版,进程和线程都面临着内核态和用户态的切换问题而耗费许多切换时间,而协程就是用户自己控制切换的时机,不再需要陷入系统的内核态.

    Python里最常见的yield就是协程的思想!

     补充

    进程间通信方式

      1.管道   

        1.它是半双工的(即数据只能在一个方向上流动),具有固定的读端和写端。 

        2.它只能用于具有亲缘关系的进程之间的通信(也是父子进程或者兄弟进程之间)。 

        3.它可以看成是一种特殊的文件,对于它的读写也可以使用普通的read、write 等函数。但是它不是普通的文件,并不属于其他任何文件系统,并且只存在于内存中。

      2.消息队列

        消息队列,是消息的链接表,存放在内核中。一个消息队列由一个标识符(即队列ID)来标识。

      1. 消息队列是面向记录的,其中的消息具有特定的格式以及特定的优先级。

      2. 消息队列独立于发送与接收进程。进程终止时,消息队列及其内容并不会被删除。

      3. 消息队列可以实现消息的随机查询,消息不一定要以先进先出的次序读取,也可以按消息的类型读取

      3.信号量

        信号量(semaphore)与已经介绍过的 IPC 结构不同,它是一个计数器。信号量用于实现进程间的互斥与同步,而不是用于存储进程间通信数据。

      1. 信号量用于进程间同步,若要在进程间传递数据需要结合共享内存。

      2. 信号量基于操作系统的 PV 操作,程序对信号量的操作都是原子操作。

      3. 每次对信号量的 PV 操作不仅限于对信号量值加 1 或减 1,而且可以加减任意正整数。

      4. 支持信号量组。

      4. 共享内存

        共享内存(Shared Memory),指两个或多个进程共享一个给定的存储区。

      1. 共享内存是最快的一种 IPC,因为进程是直接对内存进行存取。

      2. 因为多个进程可以同时操作,所以需要进行同步。

      3. 信号量+共享内存通常结合在一起使用,信号量用来同步对共享内存的访问。

  • 相关阅读:
    K8s(2)-部署应用
    Docker-常用命令(7)
    Docker-堆栈stack(6)
    Docker-集群swarm(5)
    Docker-服务(4)
    Docker的概念术语(2)
    k8s(1)-使用kubeadm安装Kubernetes
    Celery-分布式任务队列
    使用Python管理压缩包
    jQuery基础
  • 原文地址:https://www.cnblogs.com/abel01250303/p/9745187.html
Copyright © 2020-2023  润新知