• 2018-2019-1 20189219《Linux内核原理与分析》第七周作业


    task_struct数据结构

    以下摘自wiki:

    A computer program is a passive collection of instructions; a process is the actual execution of those instructions. Several processes may be associated with the same program; for example, opening up several instances of the same program often means more than one process is being executed.

    在Linux中,task_struct其实就是通常所说的PCB。该结构定义位于:

    /include/linux/sched.h
    task_struct比较庞大,大致可以分为几个部分:

    • 进程状态(State)

    • 进程调度信息(Scheduling Information)

    • 各种标识符(Identifiers)

    • 进程通信有关信息(IPC:Inter_Process Communication)

    • 时间和定时器信息(Times and Timers)

    • 进程链接信息(Links)

    • 文件系统信息(File System)

    • 虚拟内存信息(Virtual Memory)

    • 页面管理信息(page)

    • 对称多处理器(SMP)信息

    • 和处理器相关的环境(上下文)信息(Processor Specific Context)
      其它信息
      其中比较重要的几个参数:

    • volatile long state;进程状态,可见/include/linux/sched.h文件中的宏,TASK_RUNNING等

    • unsigned int rt_priority;实时优先级

    • unsigned int policy;调度策略

    • pid_t pid;进程标识符

    • struct task_struct __rcu *real_parent;real parent

    • struct list_head children;list of my children

    • struct files_struct *files;系统打开文件

    分析内核处理过程sys_clone

    fork、vfork和clone三个系统调用实际上都是通过do_fork来实现进程的创建.
    见如下语句:

    return do_fork(clone_flags, newsp, 0, parent_tidptr, child_tidptr);

    • do_fork 函数
      do_fork函数真正实现复制是copy_process
    long do_fork(unsigned long clone_flags,
              unsigned long stack_start,
              unsigned long stack_size,
              int __user *parent_tidptr,
              int __user *child_tidptr)
    {
    
        ...
        
        p = copy_process(clone_flags, stack_start, stack_size,
                 child_tidptr, NULL, trace);
      ...
    }
    
    • copy_process函数
      copy_process()主要完成进程数据结构,各种资源的初始化。
    p = dup_task_struct(current);
    
    • 1.(省略的IF语句)检查clone_flags参数,防止无效的组合进入
    • 2.p = dup_task_struct(current);调用dup_task_struct()为新进程创建一个内核栈
    • 3.判断权限及允许范围的代码
    • 4.对子进程的描述符初始化和复制父进程的资源给子进程
    - `retval = sched_fork(clone_flags, p);`完成调度相关的设置,将这个task分配给CPU
    - `if (retval)`语句群,复制共享进程的的各个部分
    - `retval = copy_thread(clone_flags, stack_start, stack_size, p);`复制父进程堆栈的内容到子进程的堆栈中去.这其中,copy_thread()函数中的语句`p->thread.ip = (unsigned long) ret_from_fork;`决定了新进程的**第一条指令地址**.
    
    • dup_task_struct()
    static struct task_struct *dup_task_struct(struct task_struct *orig)
    {
        struct task_struct *tsk;
        struct thread_info *ti;
        int node = tsk_fork_get_node(orig);
        int err;
        
        tsk = alloc_task_struct_node(node);
        if (!tsk)
            return NULL;
        
        ti = alloc_thread_info_node(tsk, node);
        if (!ti)
            goto free_tsk;
        
        err = arch_dup_task_struct(tsk, orig);
        if (err)
            goto free_ti;
        
        tsk->stack = ti;
    # ifdef CONFIG_SECCOMP
    
        tsk->seccomp.filter = NULL;
    # endif
    
        setup_thread_stack(tsk, orig);
        clear_user_return_notifier(tsk);
        clear_tsk_need_resched(tsk);
        set_task_stack_end_magic(tsk);
    
    # ifdef CONFIG_CC_STACKPROTECTOR
        tsk->stack_canary = get_random_int();
    # endif
    
        atomic_set(&tsk->usage, 2);
    # ifdef CONFIG_BLK_DEV_IO_TRACE
        tsk->btrace_seq = 0;
    # endif
        tsk->splice_pipe = NULL;
        tsk->task_frag.page = NULL;
        
        account_kernel_stack(ti, 1);
        
        return tsk;
    
    free_ti:
        free_thread_info(ti);
    free_tsk:
        free_task_struct(tsk);
        return NULL;
    }
    
    • 1.tsk = alloc_task_struct_node(node);为task_struct开辟内存
    • 2.ti = alloc_thread_info_node(tsk, node);ti指向thread_info的首地址,同时也是系统为新进程分配的两个连续页面的首地址。
    • 3.err = arch_dup_task_struct(tsk, orig);复制父进程的task_struct信息到新的task_struct里, (*dst = *src;)
    • 4.tsk->stack = ti;task的对应栈
    • 5.setup_thread_stack(tsk, orig);初始化thread info结构
    • 6.set_task_stack_end_magic(tsk);栈结束的地址设置数据为栈结束标示(for overflow detection)

    gdb跟踪sys_clone

    • 用GDB来跟踪sys_clone,设置以下断点:

    • 运行后首先停在sys_clone处:

    • 然后是do_fork,之后是copy_process:

    • 进入copy_thread:

    • 在copy_thread中,我们可以查看p的值

    • 但是回到copy_process后再查看,将得到一个value optimized out的提示,这是因为Linux内核打开gcc的-O2选项优化导致.如果想要关掉,可以参考:这里

    • ret_from_fork按照之前的分析被调用,跟踪到syscall_exit后无法继续.如果想在本机调试system call,那么当你进入system call时,系统已经在挂起状态了。如果想要跟踪调试system_call,可以使用kgdb等

    新进程是从哪里开始执行的

    在之前的分析中,谈到copy_process中的copy_thread()函数,正是这个函数决定了子进程从系统调用中返回后的执行.

    int copy_thread(unsigned long clone_flags, unsigned long sp,
        unsigned long arg, struct task_struct *p)
    {
        ...
        
        *childregs = *current_pt_regs();
        childregs->ax = 0;
        if (sp)
            childregs->sp = sp;
        
        p->thread.ip = (unsigned long) ret_from_fork;
        
        ...
    }
    

    子进程执行ret_from_fork

    ENTRY(ret_from_fork)
        CFI_STARTPROC
        pushl_cfi %eax
        call schedule_tail
        GET_THREAD_INFO(%ebp)
        popl_cfi %eax
        pushl_cfi $0x0202       # Reset kernel eflags
        popfl_cfi
        jmp syscall_exit
        CFI_ENDPROC
    END(ret_from_fork)
    

    执行起点与内核堆栈如何保证一致?

    • 1.在ret_from_fork之前,也就是在copy_thread()函数中*childregs = *current_pt_regs();该句将父进程的regs参数赋值到子进程的内核堆栈,
    • 2.*childregs的类型为pt_regs,里面存放了SAVE ALL中压入栈的参数
    • 3.故在之后的RESTORE ALL中能顺利执行下去.

    总结

    • Linux通过复制父进程来创建一个新进程,通过调用do_fork来实现
    • Linux为每个新创建的进程动态地分配一个task_struct结构.
    • 为了把内核中的所有进程组织起来,Linux提供了几种组织方式,其中哈希表和双向循环链表方式是针对系统中的所有进程(包括内核线程),而运行队列和等待队列是把处于同一状态的进程组织起来
    • fork()函数被调用一次,但返回两次.
  • 相关阅读:
    9.1做JS的题目(2)
    9.1做JS的题目
    8.31做JS的题目
    8.30做JS的题目
    扫码跳转微信小程序(服务端微信API生成二维码)
    扫码跳转微信小程序(微信公众平台配置测试二维码)
    项目配置:maven下载与配置、tomcat下载与配置
    Java基础:常用工具_API
    Java基础: 抽象类、接口、final关键字、static关键字
    java基础: 封装、继承、多态
  • 原文地址:https://www.cnblogs.com/archemiya/p/10017472.html
Copyright © 2020-2023  润新知