linux及安全第六周总结——20135227黄晓妍

linux及安全第六周总结——20135227黄晓妍

总结部分：

操作系统内核三大功能：

　　进程管理，内存管理，文件系统

最核心的是进程管理

为了管理，首先要对每一个进程进行描述。进程描述符提供了所有内核需要了解的信息。

进程控制模块：task_struct（抽象task_struct的简化图）

　　next_task,prev_task进程链表的管理

　　tty_struct控制台

　　fs_struct文件系统描述

　　file_struct打开的文件描述符

　　mm_struct内存管理的描述

　　signal_struct信号的描述

Linux-3.18.6/include/linux/sched.h里的代码

　　1235代码state进程运行状态

　　stack指定进程的内核堆栈

　　flags每个进程的标识符

　　1245CONFIG SMP条件编译，多处理器时使用到的。

　　1251on_rq运行队列

　　1295list_head tasks进程链表（双向链表）

　　linux进程的状态和操作系统原理的描述进程状态有所不同，比如就绪状态和运行状态都是TASK_RUNNING。（这个表示它是可运行的，但是实际上有没有在运行取决于它是否占有CPU）

　　1330进程标识符pid

　　1349进程的父子关系

　　1360pid_link pids[PIDTYPE_MAX]进程的哈希表

Linux-3.18.6/arch/x86/include/asm/processor.h

　　thread_struct（很重要）

进程的创建概括以及fork（）一个进程

　　Cpu_idle启动两个线程：（0号进程是所有线程的祖先）

　　　　Kernel_init用户态的进程启动，所有用户态进程的祖先（1号进程是所有进程的祖先）

　　　　Kthreadd所有线程的祖先

　　　　在shell命令行创建进程的本质一样：先复制一份进程描述符，0号进程是手工写进代码的，1号进程复制0号的pcb,然后根据1号进程的需要把它的pid等等信息修改　　　　掉，再加载一个init可执行程序。

　　进程是如何创建：

　　　　先看怎么在用户态创建一个子进程

　　　　

　　　　Pid==0是下面两个模块都会被执行，fork（）系统调用在父进程子进程各返回一次，父进程中返回0，子进程中返回子进程的pid

理解进程创建过程复杂代码的方法：

　　　　系统调用：用户态int0x80（由于是陷入进入内核的，所以机器自动保存与转换堆栈；压入用户ss，压入用户esp，压入EFLAGS，压入cs，压入eip）

　　　　中断指令跳转到内和空间sysstem_call（压入eax，把传递参数的寄存器全部压栈）执行结束后RESTORE_ALL（弹栈传递参数的寄存器，弹栈eax，iret弹栈　　　　　　int0x80压栈的东西）

　　　　Fork()的也是一个系统调用，它的过程图

　　　　

　　　　子进程复制了父进程的所有信息，然后做适当修改，它也会调度执行。当它被CPU调度的时候从哪里开始执行呢？子进程在内核里执行，在内核处理程序从哪里开始　　　　执行的？与mykernel类似。

　　　　fork,vfork,clone三个系统调用都是通过调用do_fork来创建创建一个新的进程。

先我们设想，它应该如何创建一个进程，我们画一个框架，然后再通过代码求证，再对我们的框架进行修正。

我们的框架：

　　　　1.创建新进程都是通过复制父进程的信息。

　　　　2.创建新进程的过程中需要做哪些事情：

　　　　　　复制pcb

　　　　　　还需要修改复制的父进程的pcb

　　　　　　还需要分配新的内核堆栈

　　　　　　子进程需要从fork返回到用户态，那么它内核堆栈也需要从父进程中拷贝一些过来，不然不能返回

　　　　　　还有thread.sp(调度到子进程时的内核栈顶)和thread.ip（调度到子进程的第一条指令地址）

浏览创建进程的相关关键代码

Linux-3.18.6/kernel/fork.c

　　

　　1632copy_process创建一个进程的主要代码

　　

　　　　1240dup_task_struct复制pcb（看具体怎么复制）

　　　　

　　　　

　　　　　　320arch_dup_task_struct(tsk,orig)执行复制当前进程

　　　　　　

　　　　　　　293*dst=*src数据结构的指针的值复制

　　　　　　316alloc_thread_info_node(tsk,node)，分配内核空间堆栈的作用和thread_info合在一起的集合体

　　　　　　153实际上是创建了一个一定大小的页面。一部分存放alloc_thread_info,一部分存放堆栈

　　　　　　

                            335setup_thread_stack

　　　　　　　　　　

　　　　　　　　　　

                   1240p=dup_task_struct(current);复制子进程的pcb

　　　　　　

  　　                 1396 copy_thread

                   Linux-3.18.6/arch/x86/kernel/process_32.c

                            135*childregs=task_pt_regs(p);

                            159*childregs=*current_pt_regs();将父进程的现在的状态信息赋值给子进程（拷贝内核堆栈诗句和指定新进程的第一条指令）

                            164p.thread.ip通过ret_from_fork得到。

创建的新进程是从哪里开始执行的？

Linux-3.18.6/arch/x86/include/asm/ptrace.h

Pt_regs:系统调用压栈的内容（SAVE_ALL的全部内容）

Linux-3.18.6/arch/x86/kernel/entry_32.s

290entry(ret_from_fork)新进程是从这里开始执行的

505syscall exit内核堆栈返回到系统调用以前的状态继续执行

实验部分：

使用gdb跟踪调试创建新进程的过程

cd LinuxKernel

rm menu –rf

git clone https://github.com/mengning/menu.git

cd menu

mv test_fork.c test.c//覆盖test_fork.c

make rootfs

看到增加了一个fork

使用gdb跟踪调试内核

qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img -s -S

# 关于-s和-S选项的说明：

# -S freeze CPU at startup (use ’c’ to start execution)

# -s shorthand for -gdb tcp::1234 若不想使用1234端口，则可以使用-gdb tcp:xxxx来取代-s选项

Gdb

（gdb）file linux-3.18.6/vmlinux # 在gdb界面中targe remote之前加载符号表

（gdb）target remote:1234 # 建立gdb和gdbserver之间的连接,按c 让qemu上的Linux继续运行

b sys_clone

b do_fork

b dup_task_struct

b copy_process

b copy_thread

b ret_from_fork

copy_process

dup_task_struct

将父进程的现在的状态信息赋值给子进程（拷贝内核堆栈诗句和指定新进程的第一条指令）

将子进程的栈顶保存

线程的pid保存

直到syscall_exit就跟踪不到了。

思考部分：

　　理解创建一个新进程如何创建和修改task_struct数据结构

　　　　一般通过系统调用来创建新的进程。fork（），vfork（），clone()都是通过调用do_fork来创建新进程的。要通过复制父进程的信息pcb(task_struct),然后给新　　　　的子进程分配内核堆栈，再通过copy_process来修改子进程的task_struct.

　　特别关注新进程是从哪里开始执行的？为什么从哪里能顺利执行下去？即执行起点与内核堆栈如何保证一致。

　　　　

　　　　从ret_from_thread开始执行。子进程被创建以后是在内核运行的，因为从这里开始复制父进程的task_struct,分配内核堆栈，创建进程也是一种系统调用，在内核堆栈中，执行int0x80，保存现场，来保证执行起点和内核堆栈的一致性。
相关阅读:
4-12日面向对象的组合和继承
 4-8日递归和二分查找
 4-11 对象的交互命名空间作用域
 [LeetCode]-algorithms-Reverse Integer
[LeetCode]-algorithms-Longest Palindromic Substring
[LeetCode]-algorithms-Median of Two Sorted Arrays
[LeetCode]-algorithms-Longest Substring Without Repeating Characters
[LeetCode]-algorithms-Add Two Numbers
Java中创建String的两种方式
 Java中String为什么是不可变的
原文地址：https://www.cnblogs.com/angelahxy/p/5340674.html