• 进程、线程、协程


    一、进程、线程、协程

    1,进程

    经典定义:一个执行中程序的实例。系统中的每个程序都运行在某个进程的上下文中。(-摘自 CSAPP)

    进程是系统资源分配的最小单位

    2,线程(thread)

    线程就是运行在进程上下文中的逻辑流。

    线程是操作系统能够进行运算调度的最小单位。

    3,协程

    相对子例程而言,协程更为一般和灵活,但在实践中使用没有子例程那样广泛。

    根据维基百科对子例程的描述:是一个大型程序中的某部分代码,由一个或多个语句块组成。它负责完成某项特定任务,而且相较于其他代码,具备相对的独立性。我可以将子例程理解为一个函数。

    4,区别和联系

    首先,进程提供给应用程序的关键抽象为:

    • 一个独立的逻辑控制流:它提供一个假象,好像我们的程序独占地使用处理器。
    • 一个私有的地址空间,它提供一个假象,好像我们的程序独占地使用内存系统。

    从以上描述我可以看出,一个进程是一个独立进行的任务,它占用的系统资源有:地址空间,全局变量,文件描述符,硬件资源等。

    进程出现的目的,是为了更好的利用CPU资源。例如:

    假设有两个任务A和B,当A遇到IO操作,CPU默默的等待任务A读取完操作再去执行任务B,这样无疑是对CPU资源的极大的浪费。若在任务A读取数据时,让任务B执行,当任务A读取完数据后,再切换到任务A执行,这样就可以更好地利用CPU资源。这里的切换涉及到状态的保存,状态的恢复,需要有一个东西去记录任务A和任务B分别需要什么资源,怎样去识别任务A和任务B,这时进程就出现了。

    因此,通过进程来分配系统资源,标识任务。

    如何分配CPU去执行进程称之为调度,进程状态的记录,恢复,上下文切换(简称切换)。

    其次,若上面提及的任务A是一个文本程序,需要接受键盘输入,将内容显示在屏幕上,还需要保存信息到硬盘中。

    若只有一个进程,会造成同一时间只能干一样事的尴尬(当保存时,就不能通过键盘输入内容)。若有多个进程,每个进程负责一个任务,进程A负责接收键盘输入的任务,进程B负责将内容显示在屏幕上的任务,进程C负责保存内容到硬盘中的任务。这里进程A,B,C间的协作涉及到了进程通信问题,而且有共同都需要拥有的东西-------文本内容,不停的切换造成性能上的损失。若有一种机制,可以使任务A,B,C共享资源,这样上下文切换所需要保存和恢复的内容就少了,同时又可以减少通信所带来的性能损耗,那就好了。这时线程出现了。

    因此,线程共享进程的大部分资源,并参与CPU的调度。

    假设当涉及到大规模的并发请求连接时,例如有一万个人同时连接我的服务器,但系统资源有限,如果以线程作为处理单元,调内部系统资源的话大部分线程都处于等待状态,但用了协程就可以实现线程自己调度,不陷入内核级别的上下文切换。这时协程出现了。

    因此,协程通过在线程中实现调度,避免了陷入内核级别的上下文切换造成的性能损失,进而突破了线程在IO上的性能瓶颈。

    为什么协程不需要经过内核级别的上下文切换,我是这样认为的:

    进程和线程都是操作系统自带的,协程是有些程序原生支持的,例如go,lua, 有些是后期版本才有的,比如python2.5 C#等。

    二、小结

    之前做游戏服务器时就对这块概念不是很清晰,现在做流媒体服务时又碰到了这样的困惑,因此专门看书思考整理了相关的知识点,网上也参考了许多例子。如果有错误还望及时指正。

    在此引用一位从事服务器开发的前辈说的话:

    核心只有一个,线程是操作系统调度,协程是用户态调度。 协程不必须是语言集成,例如C语言可以用setjmp/longjmp实现,也可以自己通过改变esp指针换栈实现协程。 协程本身跟高吞吐没任何关系,基于io多路复用+回调就可以实现高并发和高吞吐。引入协程是为了将回调逻辑变成线性同步逻辑。

  • 相关阅读:
    HTTP报文语法/HTTP组成
    get和post的区别
    Jmeter图形结果
    Jmeter用表格查看结果
    Jmeter聚合报告
    Jmeter查看结果树
    Jmeter集合点
    Jmeter-BeanShell Sampler调用java代码
    Jmeter简单的接口测试
    get、post接口测试-java
  • 原文地址:https://www.cnblogs.com/fengerwuyou/p/11091107.html
Copyright © 2020-2023  润新知