• 20155207 《信息安全系统设计基础》第十三周学习总结


    20155207 《信息安全系统设计基础》第十三周学习总结

    第十二章 并发编程

    程序级并发——进程

    函数级并发——线程

    三种基本的构造并发程序的方法:

    进程

    每个逻辑控制流是一个进程,由内核进行调度,进程有独立的虚拟地址空间

    I/O多路复用

    逻辑流被模型化为状态机,所有流共享同一个地址空间

    线程

    运行在单一进程上下文中的逻辑流,由内核进行调度,共享同一个虚拟地址空间

    第一节 基于进程的并发编程

    构造并发程序最简单的方法——用进程

    常用函数如下:

    fork
    exec
    waitpid
    

    构造并发服务器?

    在父进程中接受客户端连接请求,然后创建一个新的子进程来为每个新客户端提供服务。

    需要注意的事情:

    1.父进程需要关闭它的已连接描述符的拷贝(子进程也需要关闭)

    2.必须要包括一个SIGCHLD处理程序来回收僵死子进程的资源

    3.父子进程之间共享文件表,但是不共享用户地址空间,这个在以前的学习过程中提到过

    关于独立地址空间

    1.优点:防止虚拟存储器被错误覆盖

    2.缺点:开销高,共享状态信息才需要IPC机制

    第二节 基于I/O多路复用的并发编程

    就是使用select函数要求内核挂起进程,只有在一个或多个I/O事件发生后,才将控制返回给应用程序。

    select函数处理类型为fd_set的集合,即描述符集合,并在逻辑上描述为一个大小为n的位向量,每一位b[k]对应描述符k,但当且仅当b[k]=1,描述符k才表明是描述符集合的一个元素。

    描述符能做的三件事:

    分配他们
    将一个此种类型的变量赋值给另一个变量
    用FD_ZERO、FD_SET、FD_CLR和FD_ISSET宏指令来修改和检查它们

    什么时候可以读?

    当且仅当一个从该描述符读取一个字节的请求不会阻塞时

    注意:

    每次调用select函数时都需要更新读集合

    一、基于I/O多路复用的并发事件驱动服务器

    事件驱动程序:将逻辑流模型化为状态机。

    状态机:

    状态
    输入事件
    转移
    对于状态机的理解,参考EDA课程中学习的状态转换图的画法和状态机。

    整体的流程是:

    select函数检测到输入事件
    add_client函数创建新状态机
    check_clients函数执行状态转移(在课本的例题中是回送输入行),并且完成时删除该状态机。

    几个需要注意的函数:

    init_pool:初始化客户端池
    add_client:添加一个新的客户端到活动客户端池中
    check_clients:回送来自每个准备好的已连接描述符的一个文本行
    

    二、I/O多路复用技术的优劣

    1.优点

    相较基于进程的设计,给了程序员更多的对程序程序的控制
    运行在单一进程上下文中,所以每个逻辑流都可以访问该进程的全部地址空间,共享数据容易实现
    可以使用GDB调试
    高效

    2.缺点

    编码复杂
    不能充分利用多核处理器

    第三节 基于线程的并发编程

    这种模式混合了以上两种方法

    线程:就是运行在进程上下文中的逻辑流。

    每个线程都有它自己的线程上下文:

    一个唯一的整数线程ID——TID

    栈指针
    程序计数器
    通用目的寄存器
    条件码

    一、线程执行模型

    1.主线程

    在每个进程开始生命周期时都是单一线程——主线程,与其他进程的区别仅有:它总是进程中第一个运行的线程。

    2.对等线程

    某时刻主线程创建,之后两个线程并发运行。

    每个对等线程都能读写相同的共享数据。

    3.主线程切换到对等线程的原因:

    主线程执行一个慢速系统调用,如read或sleep
    被系统的间隔计时器中断
    切换方式是上下文切换

    对等线程执行一段时间后会控制传递回主线程,以此类推

    4.线程和进程的区别

    线程的上下文切换比进程快得多
    组织形式:
    进程:严格的父子层次
    线程:一个进程相关线程组成对等(线程)池,和其他进程的线程独立开来。一个线程可以杀死它的任意对等线程,或者等待他的任意对等线程终止。

    二、Posix线程

    Posix线程是C程序中处理线程的一个标准接口。基本用法是:

    线程的代码和本地数据被封装在一个线程例程中
    每个线程例程都以一个通用指针为输入,并返回一个通用指针。
    

    这里需要提到一个万能函数的概念。

    万能函数:
    
    void func(void parameter)
    typedef void (uf)(void para)
    
    即,输入的是指针,指向真正想要传到函数里的数据,如果只有一个就直接让指针指向这个数据,如果是很多就将它们放到一个结构体中,让指针指向这个结构体。后面这个方法就是万能函数的使用思想。
    

    线程例程也是这样的。

    三、创建线程

    1.创建线程:pthread_create函数

    #include <pthread.h>
    typedef void *(func)(void *);
    
    int pthread_create(pthread_t *tid, pthread_attr_t *attr, func *f, void *arg);
    

    成功返回0,出错返回非0
    创建一个新的线程,带着一个输入变量arg,在新线程的上下文运行线程例程f。

    attr默认为NULL

    参数tid中包含新创建线程的ID

    2.查看线程ID——pthread_self函数

    #include <pthread.h>
    
    pthread_t pthread_self(void);
    
    返回调用者的线程ID(TID)
    

    四、终止线程

    1.终止线程的几个方式:

    隐式终止:顶层的线程例程返回
    显示终止:调用pthread_exit函数
    *如果主线程调用,会先等待所有其他对等线程终止,再终止主线程和整个进程,返回值为pthread_return
    某个对等线程调用Unix的exit函数,会终止进程与其相关线程
    另一个对等线程通过以当前线程ID作为参数调用pthread_cancle来终止当前线程

    2.pthread_exit函数

    #include <pthread.h>
    
    void pthread_exit(void *thread_return);
    
    若成功返回0,出错为非0
    

    3.pthread_cancle函数

    #include <pthread.h>
    
    void pthread_cancle(pthread_t tid);
    
    若成功返回0,出错为非0
    

    五、回收已终止线程的资源

    用pthread_join函数:

    #include <pthread.h>
    
    int pthread_join(pthread_t tid,void **thrad_return);
    

    这个函数会阻塞,知道线程tid终止,将线程例程返回的(void*)指针赋值为thread_return指向的位置,然后回收已终止线程占用的所有存储器资源

    六、分离线程

    在任何一个时间点上,线程是可结合的,或是分离的。

    1.可结合的线程

    能够被其他线程收回其资源和杀死
    被收回钱,它的存储器资源没有被释放
    每个可结合线程要么被其他线程显式的收回,要么通过调用pthread_detach函数被分离

    2.分离的线程

    不能被其他线程回收或杀死
    存储器资源在它终止时由系统自动释放

    3.pthread_detach函数

    #include <pthread.h>
    
    void pthread_detach(pthread_t tid);
    
    若成功返回0,出错为非0
    

    这个函数可以分离可结合线程tid。

    线程能够通过以pthread_self()为参数的pthread_detach调用来分离他们自己。

    每个对等线程都应该在他开始处理请求之前分离他自身,以使得系统能在它终止后回收它的存储器资源。

    七、初始化线程:pthread_once函数

    #include <pthread.h>
    pthread_once_t once_control = PTHREAD_ONCE_INIT;
    
    int pthread_once(pthread_once_t *once_control, void (*init_routine)(void));
    
    总是返回0
    

    八、基于线程的并发服务器中的注意事项

    1.调用pthread_create时,如何将已连接描述符传递给对等进程?

    传递指针。

    2.竞争问题?

    见第七节。

    3.避免存储器泄露?

    必须分离每个线程,使它终止时它的存储器资源能被收回。

    第四节 多线程程序中的共享变量

    一个变量是共享的,当且仅当多个线程引用这个变量的某个实例。

    一、线程存储器模型

    需要注意的有:

    寄存器从不共享,虚拟存储器总是共享的。

    二、将变量映射到存储器

    三、共享变量

    变量v是共享的——当且仅当它的一个实例被一个以上的线程引用。

    第五节 用信号量同步线程

    一般而言,没有办法预测操作系统是否将为你的线程选择一个正确的顺序。

    所以——进度图

    一、进度图

    进度图是将n个并发线程的执行模型化为一条n维笛卡尔空间中的轨迹线,原点对应于没有任何线程完成一条指令的初始状态。

    当n=2时,状态比较简单,是比较熟悉的二维坐标图,横纵坐标各代表一个线程,而转换被表示为有向边

    转换规则:

    合法的转换是向右或者向上,即某一个线程中的一条指令完成
    两条指令不能在同一时刻完成,即不允许出现对角线
    程序不能反向运行,即不能出现向下或向左
    而一个程序的执行历史被模型化为状态空间中的一条轨迹线。

    线程循环代码的分解:

    H:在循环头部的指令块
    L:加载共享变量cnt到线程i中寄存器%eax的指令。
    U:更新(增加)%eax的指令
    S:将%eax的更新值存回到共享变量cnt的指令
    T:循环尾部的指令块

    几个概念

    临界区:对于线程i,操作共享变量cnt内容的指令L,U,S构成了一个关于共享变量cnt的临界区。
    不安全区:两个临界区的交集形成的状态
    安全轨迹线:绕开不安全区的轨迹线
    具体相关在操作系统课程中讲的更为详细,比如:

    临界区使用原则(互斥条件)
    
    有空让进:如果临界区空闲,则只要有进程申请就立即让其进入;
    无空等待:每次只允许一个进程处于临界区;
    多中择一:当没有进程在临界区,而同时有多个进程要求进入临界区,只能让其中之一进入临界区,其他进程必须等待;
    让权等待:进入临界区的进程,不能在临界区内长时间阻塞等待某事件,使其它进程在临界区外无限期等待;
    不能限制进程的并发数量和执行进度。
    

    二、信号量

    信号量实现互斥的基本原理

    两个或多个进程通过传递信号进行合作,可以迫使进程在某个位置暂时停止执行(阻塞等待),直到它收到一个可以“向前推进”的信号(被唤醒);
    将实现信号灯作用的变量称为信号量,常定义为记录型变量s,其一个域为整型,另一个域为队列,其元素为等待该信号量的阻塞进程(FIFO)。
    信号量定义:
    
    type semaphore=record
    count: integer;
    queue: list of process
    end;
    var s:semaphore;
    

    定义对信号量的两个原子操作——P和V

    P(wait)
    
    wait(s)
    s.count :=s.count-1;
    if s.count<0 then
    begin
    进程阻塞;
    进程进入s.queue队列;
    end;
    
    V(signal)
    
    signal(s)
    s.count :=s.count+1;
    if s.count ≤0 then
    begin
    唤醒队首进程;
    将进程从s.queue阻塞队列中移出;
    end;
    

    需要注意的是,每个信号量在使用前必须初始化。

    三、使用信号量来实现互斥

    1.基本思想

    将每个共享变量(或者一组相关的共享变量)与一个信号量s(初始为1)联系起来,然后用P和V操作将相应的临界区包围起来。

    2.几个概念

    二元信号量:用这种方式来保护共享变量的信号量叫做二元信号量,取值总是0或者1.
    互斥锁:以提供互斥为目的的二元信号量
    加锁:对一个互斥锁执行P操作
    解锁;对一个互斥锁执行V操作
    计数信号量:被用作一组可用资源的计数器的信号量
    禁止区:由于信号量的不变性,没有实际可能的轨迹能够包含禁止区中的状态。

    3.wait(s)/signal(s)的应用

    进程进入临界区之前,首先执行wait(s)原语,若s.count<0,则进程调用阻塞原语,将自己阻塞,并插入到s.queue队列排队;
    注意,阻塞进程不会占用处理机时间,不是“忙等”。直到某个从临界区退出的进程执行signal(s)原语,唤醒它;
    一旦其它某个进程执行了signal(s)原语中的s.count+1操作后,发现s.count ≤0,即阻塞队列中还有被阻塞进程,则调用唤醒原语,把s.queue中第一个进程修改为就绪状态,送就绪队列,准备执行临界区代码。
    

    以及

    wait操作用于申请资源(或使用权),进程执行wait原语时,可能会阻塞自己;
    signal操作用于释放资源(或归还资源使用权),进程执行signal原语时,有责任唤醒一个阻塞进程。
    

    三、利用信号量来调度共享资源

    也就是说,信号量有两个作用:

    实现互斥
    调度共享资源

    信号量分为:互斥信号量和资源信号量。
    
    互斥信号量用于申请或释放资源的使用权,常初始化为1;
    
    资源信号量用于申请或归还资源,可以初始化为大于1的正整数,表示系统中某类资源的可用个数。
    

    1.信号量的物理意义

    s.count >0表示还可执行wait(s)而不会阻塞的进程数(可用资源数)。每执行一次wait(s)操作,就意味着请求分配一个单位的资源。
    当s.count ≤0时,表示已无资源可用,因此请求该资源的进程被阻塞。此时,s.count的绝对值等于该信号量阻塞队列中的等待进程数。执行一次signal操作,就意味着释放一个单位的资源。若s.count<0,表示s.queue队列中还有被阻塞的进程,需要唤醒该队列中的第一个进程,将它转移到就绪队列中。
    

    2.常见问题

    这里的常见问题有生产者-消费者问题,和读者-写者问题,都是操作系统课程中详细讲述过的,不再赘述。

    第七节 其他并发问题

    一、线程安全性

    一个线程是安全的,当且仅当被多个并发线程反复的调用时,它会一直产生正确的结果。

    四个不相交的线程不安全函数类以及应对措施:

    不保护共享变量的函数——用P和V这样的同步操作保护共享变量
    保持跨越多个调用的状态的函数——重写,不用任何static数据。
    返回指向静态变量的指针的函数——①重写;②使用加锁-拷贝技术。
    调用线程不安全函数的函数——参考之前三种

    二、可重入性

    当它们被多个线程调用时,不会引用任何共享数据。

    1.显式可重入的:

    所有函数参数都是传值传递,没有指针,并且所有的数据引用都是本地的自动栈变量,没有引用静态或全剧变量。

    2.隐式可重入的:

    调用线程小心的传递指向非共享数据的指针。

    三、在线程化的程序中使用已存在的库函数

    一句话,就是使用线程不安全函数的可重入版本,名字以_r为后缀结尾。

    四、竞争

    1.竞争发生的原因:

    一个程序的正确性依赖于一个线程要在另一个线程到达y点之前到达它的控制流中的x点。也就是说,程序员假定线程会按照某种特殊的轨迹穿过执行状态空间,忘了一条准则规定:线程化的程序必须对任何可行的轨迹线都正确工作。

    2.消除方法:

    动态的为每个整数ID分配一个独立的块,并且传递给线程例程一个指向这个块的指针

    五、死锁:

    一组线程被阻塞了,等待一个永远也不会为真的条件。

    1.条件

    • 互斥占用
    • 占有且等待
    • 不可剥夺

    2.解决死锁的方法

    a.不让死锁发生:

    静态策略:设计合适的资源分配算法,不让死锁发生---死锁预防;
    动态策略:进程在申请资源时,系统审查是否会产生死锁,若会产生死锁则不分配---死锁避免。

    b.让死锁发生:

    进程申请资源时不进行限制,系统定期或者不定期检测是否有死锁发生,当检测到时解决死锁----死锁检测与解除

    课后习题

    • 12.1 在下图中,并发服务器的第33行上,父进程关闭了已连接描述符后,子进程仍能够使用该描述符和客户端通信,为什么。
    当父进程派生子进程时,它得到一个已连接描述符的副本,并将相关文件表中的引用计数从1增加到2.当父进程关闭它的描述符副本时,引用计数就从2减少到1.因为内核不会关闭一个文件,知道文件表中它的引用计数值变为0,所以子进程这边的连接端将保持打开。
    
    • 12.2 如果我们要删除图12-5中关闭已连接描述符的第30行,从没有内存泄漏的角度来说,代码将仍然是正确的,为什么
    当一个进程因为某种原因终止时,内核将关闭所有打开的描述符。因此,当子进程退出时,它的已连接文件描述符的副本也将被自动关闭。
    
    • 12.3 在Linux系统里,在标准输入上键入Ctrl+D表示EOF。图12-6中的程序阻塞在对select的调用上,如果你键入Ctrl+D会发生什么
    如果一个从描述符中读一个字节的请求不会阻塞,那么这个描述符就准备好可以读了。假如EOF在一个描述符上为真,那么描述符也准备好可读了,因为读操作将立即返回一个零返回码,表示EOF。因此,键入Ctrl+D会导致select函数返回,准备好的集合中有描述符0。
    
    • 12.4 图12-8所示的服务器中,我们在每次调用select之前都立即小心地重新初始化pool.ready_set变量,为什么?
    因为变量pool.read_set既作为输入参数,也作为输出参数,所以我们在每一次调用select之前都重新初始化它。在输入时,它包含读集合。在输出时,它包含准备好的集合。
    
    • 12.5在下图中基于进程的服务器中,我们在两个位置小心地关闭了已连接描述符:父进程和子进程。然而,在图2中,基于线程的服务器中,我们只在一个位置关闭了已连接描述符:对等线程,为什么?
    因为线程运行在同一个进程中,它们都共享相同的描述符表。无论有多少线程使用这个已连接描述符,这个已连接描述符的文件表的引用计数都等于1.因此,当我们用完它时,一个close操作就足以释放于这个已连接描述符相关的内存资源了。
    
    • 12.6

    解:

    上周考试错题总结

    • 1、( 多选题 | 1 分)
      实验5:使用openssl进行混合密码系统加密时,会话秘钥的分发最可能用到()
      A .
      AES_encrypt
      B .
      RSA_public_encrypt
      C .
      AES_decrypt
      D .
      RSA_private_decrypt
      E .
      AES_cbc_encrypt
      F .
      RSA_private_encrypt
      G .
      RSA_public_decrypt
      正确答案: B D
    非对称算法的应用:
    秘钥分发:用对方公钥加密,对方用自己的私钥解密
    签名验签:签名主要是用自己私钥加密,对方用自己公钥验签
    

    代码托管

    结对及互评

    点评模板:

    • 博客中值得学习的或问题:
      • xxx
      • xxx
      • ...
    • 代码中值得学习的或问题:
      • xxx
      • xxx
      • ...
    • 其他

    本周结对学习情况

    - [20155223](博客链接)
    - 结对照片
    - 结对学习内容
        - XXXX
        - XXXX
        - ...
    

    其他(感悟、思考等,可选)

    第十二章已经在本学期已经是第二遍学习了,但仍有许多知识是之前没有掌握的 。第十二章讲的是并发编程,需要结合代码的学习才能掌握的更加牢固。

  • 相关阅读:
    debug和release转载
    坐标系与基本图元(8)
    坐标系与基本图元(7)
    坐标系与基本图元(5)
    坐标系与基本图元(6)
    坐标系与基本图元(4)
    坐标系与基本图元(3)
    坐标系与基本图元(2)
    BZOJ 1090
    Xor
  • 原文地址:https://www.cnblogs.com/lnaswxc/p/8053265.html
Copyright © 2020-2023  润新知