• 进程、线程和协程


    对进程、线程和协程的理解以及它们的区别 

    一、进程

    先来了解一下操作系统的进程:

    操作系统对正在运行程序的抽象,这个就是进程(process)。

    比如运行一个 web 浏览器,一个 text 文本,都是运行的一个一个进程。

    有的人说:进程是程序运行资源的集合。进程是系统资源分配的最小单位等等。

    从静态的角度来说,进程确实是运行程序的各种资源集合。

    如果你进一步思考,进程里的各种资源都有哪些呢?如下图所示:

    image-20220425233252807

    ​ (图1:进程资源)

    • 内存管理相关

    • 文件系统

    • 调度相关

    • 信号处理

    • 内核栈

    • 进程各种状态

    • 进程运行时统计信息

    • 进程标识

    等等。

    可以看出,进程中的资源是相当多的。

    从 Linux 操作系统对进程的定义也可以看出。我以前对进程结构 task_struct 分析文章:Linux进程: task_struct结构体成员

    多进程:操作系统有多个程序运行,那么就有多个进程,如下所示简图:

    image-20220425183626070

    ​ (图2:多进程简图)

    二、线程

    2.1 什么是线程?

    《操作系统设计与实现》里说:

    在传统操作系统中,每个进程中只存在一个地址空间和一个控制流(thread)。

    然后,有些情况下,需要在相同地址空间中有多个控制流并行的运行,就像他们是单独的进程一样(只是他们共享相同的地址空间)。

    这些控制流通常被称为线程(thread),有时也称为轻量级进程(lightweight process)。

    尽管线程必须在进程中执行,但是线程和进程是可以分别对待处理的两个概念。进程用来集合资源,而线程是 CPU 调度的实体。

    线程给进程模型增加的是,允许在同一个进程环境中有多个执行流,这些执行流在很大程度上相对独立。

    也即是说,在进程中,程序执行的最小单位(执行流)是线程,可以把线程看作是进程里的一条执行流。

    一个进程里可以有一条或多条线程。

    image-20220425204853673

    ​ (图3:进程里的线程)

    2.2 为什么会有多线程?

    在一个应用程序执行过程中,应用程序里可能会有多种事件执行。

    而有些事件执行一段时间后可能会被阻塞。如果把应用程序执行事件分解成多个并行运行的线程,即可以让程序设计变得简单,如果有阻塞的,

    可以把这部分让出行换其他线程执行。

    还有一个原因是:

    线程比进程更轻量级。所以线程比进程更加容易创建,销毁。

    第三个跟第一个有点关系,是关于性能的,若多线程都是 CPU 密集型的,那么不能获取性能上增强。如果有大量计算和大量 I/O 处理,那么

    多线程就可以获取性能上的优势,因为允许多线程重叠执行。

    多线程的缺点:

    1. 对于多线程来说,进程中的资源是共享的,所以会产生资源竞争。
    2. 当进程中的一个线程崩溃了,会导致这个进程里的其他线程也崩溃。所以有时多进程程序更好,一个进程崩溃不会导致其他进程也崩溃。

    三、进程与线程区别

    从上面进程和线程介绍知道,线程是程序执行流的最小单位,进程是操作系统分配资源的单位。

    进程与进程之间关系:

    进程与进程之间是相互独立的。

    线程与进程关系:

    线程是进程里的执行流,进程里的线程可以是一个,也可以是多个。

    所有线程共享进程里一些资源,比如代码,数据,地址空间,信号处理,打开文件,全局变量等。

    同时,线程也有自己的寄存器,程序计数器,堆栈,线程状态等

    image-20220425233616408

    ​ (图4:进程与线程关系)

    四、协程

    协程是建立在线程之上,一般是语言级别的 ”多线程“ 模型,比线程更加的轻量级。有的叫它微线程。它是完全运行在用户态里。

    协程是在线程之上在进行抽象,它需要线程来承载运行。一个线程可以有多个协程。

    比如 Go 语言的 goroutine,它用一个关键字 go 就可以运行一个协程程序。

    在 Go 语言里面,协程是由 Go 提供的 runtime 来控制和调度。

    协程的优点:

    1. 协程栈很小,只有几KB,而线程栈是 1 M,对比起来,创建大量协程需要的内存更少。

    2. 协程的调度是语言提供的 runtime 来调度,是在用户空间直接调度,不需要在内核空间和用户空间来回切换,浪费效率。

    3. 能更好的利用 cpu 的多核,提高程序执行性能。

    4. 避免阻塞,如果协程所在的线程发生了阻塞,那么协程调度器可以把运行在阻塞线程上的协程,调度到其它没有发生阻塞的线程上,继续运行。

    五:协程与线程区别

    1. 协程是运行在线程之上,一个线程可以有多个协程。就像一个进程里可以有多个线程一样。
    2. 协程能更好的控制利用多核机制。比如 Go 协程可以控制运行在多少个 CPU 的核上。
    3. 协程是在用户空间完成调度,由语言提供的 runtime 进行调度完全用户态。线程由内核调度。
    4. 协程使用内存更小。

    六:Golang 中协程与线程关系

    Go 中的协程相当于一个”微线程“,由 Go runtime 调度使用。它的调度模型是一个 GMP 模型,对于 Go 调度的基本了解可以看 这里还有这里

    简单介绍下 GMP :

    G:goroutine,表示 go 的一个协程,也就是”微线程“。

    M:machine,表示线程,G 在 M 上运行。

    P:processor,它包含了运行 goroutine 所需资源。如果一个 M 想运行一个 goroutine,那么先要获取 processor。

    Go 中 goroutine 和线程关系?

    goroutine 协程都是运行在线程上的。

    GMP 与线程关系简图:

    image-20220501152525407

    ​ (图5:协程、线程关系简图)

    七、几点思考

    • 1.从上面进程、线程再到协程的发展来看,技术是一直在进步。

    • 2.但是进步有多快?

    它是一个缓慢发展的过程。重要的技术进步,并不是 1 年,2 年内就能完成的,而是要发展多年才慢慢完成,到能工程使用。

    • 3.我们常说 IT 技术发展很快,到底是快在哪里呢?

    是技术本身发展很快吗?
    重要的 IT 技术发展其实没有多快。单位都是以年计量。

    是技术应用发展快吗?
    也没有,要么从线下搬到了线上,本质还是没变,IT 技术使资源分配效率加快。但 IT 技术并没有改变事情的本质。

    • 4.从进程、线程到协程,可以看出,技术是在往用户(用户空间)方向发展,往上层发展,人可以控制的方向发展。

    • 5.我们常说跟不上 IT 技术的发展,跟不上的原因是什么,问题到底出在哪儿?

    我说个原因:可能是年龄大了后,花在 IT 技术上的时间慢慢变少了。大了后,事情变多了,刚毕业时事情少,最重要的就是工作。
    后面,成家了,家里的事情会分掉你的一部分时间和精力。
    老人年纪大了,也需要你照料,以前是他们照顾你,让你专心上学和工作。

    年龄慢慢变大后,可能那种 “stay hungry” 的心也在渐渐消退,追新 IT 技术,学新知识意愿减退。

    另外,虽然技术进步不是很快,但是还是会进步,你不跟上技术进步的步伐,就可能会落伍。

    最后,行业也会变化,也可能是一部分原因。比如现在互联网教育行业的变化。

    其他原因留给读者思考,评论。 当然,更欢迎大家点推荐!

    八、参考

    == just do it ==
  • 相关阅读:
    xcode Git
    The OAuth 2.0 Authorization Framework
    Apache Commons 工具集介绍
    遍历map
    ClassLoader 提供了两个方法用于从装载的类路径中取得资源:
    转:mysql 索引
    StringBuilder与StringBuffer
    第四次作业
    Java Class 与 Object
    软件测试中条件覆盖,路径覆盖,语句覆盖,分支覆盖的区别
  • 原文地址:https://www.cnblogs.com/Leo_wl/p/16559241.html
Copyright © 2020-2023  润新知