• linux 之进程基础 (三)、进程API之创建进程 fork、vfork函数


    3. 进程API之创建进程 fork、vfork函数

    3.1 fork函数

    3.1.1 fork 函数原型

    Fork 的英文意思是叉子 ,意思是 从一个进程分出多个进程 (两个执行流)。

    #include <sys/types.h>
    #include <unistd.h>
    pid_t fork(void);
    

    返回值:

    • 返回0 : 子进程的执行流
    • 返回>0:父进程的执行流
    • 返回-1: 创建失败

    功能

    • 创建一个进程。

    fork函数的特点:

    • fork被调用一次,但返回两次。唯一的区别是在子进程里返回值是0,而在父进程里其返回值是子进程的进程ID。

    3.1.2 fork 创建进程的系统中的体现

    • 内核为子进程创建了一个新的task_struct结构。
    • 子进程几乎是父进程的克隆体,它将获得父进程数据空间、堆、栈等资源的副本。
    • 但是task_struct结构有部分内容不一样。比如process id 等。
    • 父进程和子进程共享物理内容中同一个代码段。
    • 复制时复制了父进程的堆栈段,pc指针(正要执行的程序),所以两个进程都停留在fork函数中,等待返回。因此fork函数会返回两次,一次是在父进程中返回,另一次是在子进程中返回,这两次的返回值是不一样的。(fork的返回的存储是内核帮我们实现的)。函数返回时pid所在栈段被复制并填写了不同的返回值。

    3.1.3 fork出来的进程与父进程的关系

    图片来自于网络

    3.2 fork 函数 的实现

    3.2.1 fork 函数的经典实现

    在这里插入图片描述
    从示意图可以看出:

    • 子进程p2 的代码段由p1 复制而来,但是两个进程的代码段映射到了同一片物理内存空间中。即,父进程与子进程共享同一代码段。
    • 子进程p2 的堆、栈、数据段由p1 复制而来,并且映射的物理内存也是不同片的物理内存。即,父进程与子进程的堆、栈、数据段空间各自独立。

    上述就是fork() 函数的经典实现。

    3.2.2 fork 函数的优化实现

    3.2.2.1 copy on write 技术

    目前的linux操作系统的实现中支持写时复制技术(copy on write,COW),fork函数的实现就运用了写时复制技术。这在一定程度上改进了fork函数的效率。

    传统的fork直接把所有资源复制给新建的子进程,这种实现过于简单并且效率低下,因为它拷贝的数据也许并不共享,更糟的情况是,如果新进程打算立即执行一个新的程序(exec),那么所有的拷贝工作都将前功尽弃。

    运用写时拷贝技术(copy-on-write),内核只为新生成的子进程创建虚拟空间结构,它们来复制于父进程的虚拟空间结构。但是系统并不为这些段分配物理内存,它们和父进程共享物理内存。即,父子进程的虚拟地址空间是独立的,但是虚拟地址空间映射到同一片物理内存上。

    当父子进程中有更改相应段的行为发生时,再为子进程相应的段分配物理空间。也就是说,资源的复制只有在需要写入的时候才进行,在此之前,只是以只读方式共享。这种技术使地址空间上的页的拷贝被推迟到实际发生写入的时候。

    这种fork函数的实现不仅节约了物理内存,并且提高了程序的效率。(因为暂时不需要拷贝动作了。)

    3.2.2.2 采用copy on write技术的fork函数的实现

    在这里插入图片描述

    3.2几个特殊的进程

    3.2.1获取进程ID、父ID函数

    pid_t getpid(void); //返回调用进程的ID号
    pid_t getppid(void);//返回调用进程的父ID号
    

    3.1.2 系统中几个特殊的进程

    • Init 进程是用户空间运行的第一个进程 进程id为1
    • 0 号进程是操作系统跑起来运行的第一个进程 1号进程 和2号进程都非常重要。许多用户空间进程都是1号进程的子进程。
    • 2号进程负责内核空间。 1号进程是所有用户进程的祖先。

    注意:用户空间在运行之前,内核(空间)已经在运行。 系统关闭1号进程才结束。

    3.1.3 孤儿进程

    父进程创建子进程后,谁先结束谁后结束是不一定的。由调度算法决定。

    • 如果父进程,在子进程结束之前先结束。那么子进程就会变成孤儿进程,随后init 来接管他,成为他的父进程。
    • 如果子进程,在父进程结束前先结束,且父进程一直不退出。那么子进程就会变成僵尸进程。

    3.1.4 几个疑问

    (1)一般编程时,需要父进程后退出。为什么父进程要求父进程后退出?

    因为父亲死了,init进程就会称为子进程的父亲。为了避免init被塞进太多的进程,则需要父进程不退出。

    (2)为什么需要僵尸状态?

    因为子进程的退出状态很重要,它可以返回子进程的死亡状态。因为,只有回收了子进程的退出状态,才能清理僵尸状态进程的资源(代表进程的struct 结构)。

    3.3 vfork 函数

    3.3.1 vfork函数的原理

    在这里插入图片描述从示意图可以看到,vfork()这个做法更加火爆,内核连子进程的虚拟地址空间结构也不创建了,直接共享了父进程的虚拟空间,当然了,这种做法就顺水推舟的共享了父进程的物理空间。即,父子进程既共享虚拟地址空间,又共享物理内存空间。

    3.3.2 vfork 函数的使用方法

    (1)函数原型
    #include <sys/types.h>
    #include <unistd.h>
    pid_t vfork(void);
    
    (2)函数返回值
    • 成功:子进程中返回 0,父进程中返回子进程 ID。pid_t,为无符号整型。
    • 失败:返回 -1。
    (3)函数功能

    vfork() 函数和 fork() 函数。一样都是在已有的进程中创建一个新的进程,但它们创建的子进程是有区别的。

    3.4vfork 函数的创建的进程与fork函数创建进程的区别

    (1)运行顺序不一样

    • fork(): 父子进程的执行次序不确定。
    • vfork():保证子进程先运行,在它调用 exec(进程替换) 或 exit(退出进程)之后父进程才可能被调度运行。(不可中断睡眠状态)

    (2)地址空间的共享不一样

    • fork函数: 子进程拷贝父进程的地址空间,子进程是父进程的一个复制品。
    • vfork函数:子进程共享父进程的地址空间

    注意:准确来说,在调用 exec(进程替换) 或 exit(退出进程) 之前与父进程数据是共享的。

  • 相关阅读:
    安装tensorflow-gpu
    Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA
    js,jq获取父,兄弟,子节点整理
    dos 命令
    用JavaScript实现自动点击由confirm弹出的对话框中的“确定”按钮
    解决UnicodeEncodeError: 'gbk' codec can't encode character u'u25aa' in position 344 : illegal multiby
    JS中的document.title可以获取当前网页的标题
    python中的3目运算(3元表达式)
    ajax 怎么重新加载页面
    python win32api 如何用代码模拟点击网页confirm框的确定按钮
  • 原文地址:https://www.cnblogs.com/lasnitch/p/12764131.html
Copyright © 2020-2023  润新知