第一章 Linux内核简介
1. Unix内核的特点
- 简洁:仅提供系统调用并有一个非常明确的设计目的
- 抽象:几乎所有东西都被当做文件
- 可移植性:使用C语言编写,使得其在各种硬件体系架构面前都具备令人惊异的移植能力
- 进程:创建迅速,一次执行保质保量地完成一个任务;独特的fork系统调用
- 清晰的层次化结构:策略和机制分离的理念,简单的进程间通信元语把单一目的的程序方便地组合在一起
2. 关于Linux内核简介
- Linux是基于Unix的类Unix系统,设计思想相似,比如它也实现了Unix的API。但是Linux没有直接使用Unix的源代码,但它没有抛弃Unix的设计目标并且保证了应用程序编程接口的一致。
- Linux内核是自由公开软件。
- Linux系统的基础是内核、C库、工具集和系统的基本工具。
3. 操作系统和内核简介
- 操作系统是整个系统中负责完成最基本功能和系统管理的部分。包括内核、设备驱动程序、启动引导程序、命令行Shell或者其他种类的用户界面、基本的文件管理工具和系统工具。
- 内核是操作系统的核心。通常一个内核由负责响应中断的中断服务程序、负责管理多个进程从而分享处理器时间的调度程序、负责管理进程地址空间的内存管理程序和网络、进程之间通信等系统服务程序共同组成。
- 系统态:拥有受保护的内存空间和访问硬件设备的所有权限。(内核空间即这种系统态和被保护起来的内存空间)
- 用户态:执行普通用户程序时,系统以用户态进入用户空间执行。(应用程序在用户空间执行,只能看到允许它们使用的部分系统资源,并只使用某些特定的系统功能,不能直接访问系统硬件,也不能访问其他的内核划给别人的内存范围)
- 系统中运行的应用程序通过系统调用来与内核通信。(应用程序通过系统调用界面陷入内核,是应用程序完成工作的基本行为方式)
- 中断机制:一个异步的中断信号打断处理器的执行,继而打断内核的执行。中断通常对应一个中断号,内核通过中断号查找相应的中断服务程序,并调用这个程序响应和处理中断。
- 每个处理器在任何指定时间点上的活动必然是以下三者之一:
- 运行于用户空间,执行用户进程
- 运行于内核空间,处于进程上下文,代表某个特定的进程执行
- 运行于内核空间,处于中断上下文,与任何进程无关,处理某个特定的中断
4. Linux内核和传统Unix内核的比较
- 单内核
- 整个内核都在一个大内核地址空间上运行。
- 优点:简单、高效。所有内核都在一个大的地址空间上,所以内核各个功能之间的调用和调用函数类似,几乎没有性能开销。
- 缺点:一个功能的崩溃会导致整个内核无法使用。
- 微内核
- 内核按功能被划分成各个独立的过程。每个过程独立的运行在自己的地址空间上。
- 优点:安全。内核的各种服务独立运行,一种服务挂了不会影响其他服务。
- 缺点:内核各个服务之间的调用涉及进程间的通信,比较复杂且效率低。
- Linux内核设计
- · 基于单内核
- 具备微内核的一些特征:模块化设计、抢占式内核、支持内核线程、动态装载内核模块。
- 规避微内核设计上的性能缺陷:让所有事情运行在内核态,直接调用函数,无需消息传递。
- Linux内核特征
- - 支持动态加载内核模块
- 支持对称多处理(SMP)
- 内核可以抢占(preemptive),允许内核运行的任务有优先执行的能力
- 不区分线程和进程
5. Linux内核版本
Linux内核有两种:稳定的(具有工业级的强度,可以广泛应用和部署)、处于开发中的。
Linux命名机制(可用于区分稳定的和处于开发中的内核):
如果版本号是偶数,则内核是稳定版;如果是奇数,内核就是开发版。
第二章 从内核出发
一、获取内核源码
1. Git
git实际上是一种开源的分布式版本控制工具。 Linux作为一个开源的内核,其源代码也可以用git下载和管理
- 获取最新提交到版本树的一个副本
- $ git clone git://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux-2.6.git
- 下载代码后,更新自己的分支到最新分支
- $ git pull
2.安装内核源代码
压缩形式为bzip2:$ tar xvjf linux-x.y.z.tar.bz2
压缩形式为zip:$ tar xvzf linux-x.y.z.tar.gz
关于参数:
-x 解开.tar格式的文件
-v 显示详细信息
-j 使用bzip2程序
-z 使用gzip程序
-f 使用归档文件
3. 使用补丁
从内部源码树开始,运行$ patch -p1 < ../patch-x,y,z
二、内核源码结构
三、编译内核
3.1 配置内核
配置项的二选一和三选一:
二选一:yes 或者 no
三选一:yes 或者 no 或者 module(module意味着该配置被选定了,以模块生成。驱动程序一般都用三选一的配置项)
字符页面的命令行工具:
make config
图形界面工具:
make menuconfig
基于默认配置为体系结构创建一个配置:
make defconfig
验证和更新配置:
make oldconfig
3.2 编译内核
编译内核:
make
重定向到该文件中:
make > .. /detritus
把无用的输出信息重定向到永无返回值的黑洞中:
make > /dev/null
3.3 安装新内核
将所有已编译的模块安装到正确的主目录/lib/modules下
make modules_install
四、内核开发特点
1. 无libc库/标准头文件
原因:(速度与大小)保证内核高效和简练。
内核源代码文件不能包含外部头文件。
基本头文件:内核源代码顶级目录下的include中
体系结构相关头文件:内核源代码树的arch/<architecture>/include/asm目录下
printk()函数:把格式化好的字符串拷贝到内核日志缓冲区上,syslog程序可以通过读取该缓冲区来获取内核信息。
2. 必须使用GNU C
什么是GNU?GNU是一种操作系统,GNU提供的C编译器就是我们之前使用的gcc。
(1)内联函数
static inline void wolf(unsigned long tail_size);
- static:关键字
- inline:用于限定关键字
内联函数:编译时在它被调用的地方展开。
优点:减少了函数调用的开销,性能较好。
缺点:频繁的使用内联函数也会使代码变长,从而在运行时占用更多的内存。
定义内联函数特点:时间要求高,本身长度较短的函数。
使用之前就要定义好内联函数,一般在头文件中定义。
为了类型安全和易读性,优先使用内联函数而不是复杂的宏。
(2)内联汇编
unsigned int low, high;
asm volatile("rdtsc" : "=a" (low), "=d" (high));
/* low 和 high 分别包含64位时间戳的低32位和高32位 */
- asm:嵌入汇编代码
- volatile:不优化
汇编语言用于偏近底层或对执行时间严格要求的地方。
(3)分支声明
/* 如果error在绝大多数情况下为0(假) */
if (unlikely(error)) {
/* ... */
}
/* 如果success在绝大多数情况下不为0(真) */
if (likely(success)) {
/* ... */
}
对于条件选择语句,在一个条件经常/很少出现时,编译器可通过gcc内建的一条指令对条件分支选择进行优化。
内核把这条指令封装成了宏。
3. 没有内存保护机制
内核自己非法访问内存的风险
内核中的内存都不分页:每用掉一个字节,物理内存都减少一个
4. 难以执行浮点运算
使用浮点数时,需要人工保存和恢复浮点寄存器及其他一些繁琐的操作。
不建议使用
5. 每个进程只有一个很小的定长堆栈
内核栈的大小是编译内核时决定的,对于不用的体系结构,内核栈的大小不一样,但都是固定的。(不像用户空间的栈可以动态增长)
6. 必须时刻注意同步和并发
原因:
Linux是抢占多任务操作系统
内核支持对称多处理器系统(SMP)
中断异步到来
内核可以抢占
常用解决方法:自旋锁和信号量
7. 考虑可移植性的重要性
需要保持的特点:大部分C语言代码与体系结构无关。