[Linux 001]——计算机和操作系统的基础知识

[Linux 001]——计算机和操作系统的基础知识
　　在正式开始学习 Linux 操作系统之前，有必要先回顾/学习一下计算机和操作系统的基本知识，为我们在后续的学习中铺路搭桥，在了解计算机一些基础原理的条件下再去进行学习，理解应该会更透彻一些。我会从一个程序的简单构成开始，逐步介绍我对计算机工作原理的一些理解，希望能够给大家做一个参考。由于中间涉及的知识很多，有些内容我没有进行深究，存在许多漏洞，因此仅供参考。

　　1.程序的构成

　　程序是由什么构成的？简单说来，这里有一个公式：程序 = 数据 + 指令。这是程序员再熟悉不过的了，数据自不用多说，指令就是告诉程序，怎样操作目标数据，这个“操作”不仅仅是在数据之间进行简单的运算，而是包含了操作这些数据的一系列行为的集合，比如做两个数字的加法运算，除了本身的加法这一指令之外，我们还需告诉CPU从哪里读取目标数据，以及完成加法操作后将数据放到何处等。

　　计算机的底层是二进制数据，因此不管是指令还是数据，最终都会以二进制的形式保存。对于CPU，怎么区分我们传入的二进制代码是数据还是指令呢？这就需要不同的线路将数据和指令进行分离。
- 控制（指令）总线：用来向CPU传输指令
- 数据总线：用来向CPU传输数据
　　2.CPU的简单理解

　　一个CPU的核心部件包括三个：运算器，控制器和寄存器。

　　运算器是执行运算操作的地方，它会接收数据的输入，在内部计算完成之后将数据输出。

　　光有运算器还是不够的，由于我们的指令和数据都是保存在内存中，运算器需要知道在内存的哪个地方读取数据，哪个地方读取指令，以及在计算完成之后将数据放到哪里等。这些信息就是由控制器提供的。

　　寄存器是做什么的？寄存器也叫暂存器，顾名思义，就是暂时保存数据的地方。寄存器位于CPU的内部，用以保存等待处理或者处理过的数据。为什么需要寄存器？比如我们做一个四则运算，每次运算之后的结果应该保存在哪里？内存吗？如果将每步运算结果保存在内存中，无疑是加大了CPU的开销，因为要在每步计算完成之后将其放入内存中，然后再读取出来，再输入到运算器进行计算……这很麻烦，开销很大，并且浪费了CPU宝贵的性能。寄存器的作用就是将数据暂时存放在CPU的内部，那么CPU在访问这些数据的时候，效率将会得到极大的提高（就近原则）。

　　3.中断机制（Interrupt）

　　计算机有很多I/O设备，比如键盘，鼠标，光驱，磁盘，硬盘等。如果我们敲击了键盘，CPU怎么知道我们操作的是键盘而不是鼠标或者光驱呢？我们可以将敲击键盘这个行为当做一个事件，这个事件是偶发的，CPU如果想侦测到这个事件，有两个方式可以选择：
- 轮询机制（Poll）：CPU比较勤快，每隔一段时间就去看看，有没有发生这个事件，如果发生了，就执行某个操作，如果没有发生事件，则不做任何处理。
- 中断机制（Interrupt）：CPU比较懒，并不想总是去查看这些事件有没有发生，而是找另一个人帮忙看着，如果发生了事件，就通知CPU，CPU再去做相应处理。
　　和CPU一样，我们都非常勤（lan）快（duo），喜欢轻松又有保障的活。对于轮询机制，有一个问题：事件是有随机性的，有可能CPU轮询了一天，用户并没有做出任何操作，那不是亏大发了吗。所以我们肯定会选择中断机制啦，事实上CPU采用的也正是中断机制。

　　4.中断控制器

　　上面说了CPU的中断机制。那么问题来了，CPU又怎么知道是鼠标还是键盘上产生了事件？

　　这时候中断控制器就登场了。中断控制器和CPU的针脚相连，如果把中断控制器比做蜘蛛，它将通过周围遍布的蛛网和计算机上的I/O设备连接，如果某个I/O设备上产生了一个事件，就会发生电信号的变化，这个变化通过蛛网传给中断控制器，控制器也就知道是哪一个设备发生了响应，进而将讯息传递给CPU。

　　5.南桥和北桥

　　对于计算机中的数据处理，有高速低速之分，或者高频和低频之分。南桥和北桥就是分别用来传输这两种类型的数据，北桥在物理上距离CPU较进，用来处理高速高频的数据。大多数的I/O设备都在南桥上，这些设备经过南桥汇总后，通过线路连接传到北桥，再由北桥传给CPU。

　　举例：一个网页同时给一百万个用户访问，网页文件存放在服务器的硬盘中，服务器的每次响应都需要从硬盘中读取这个网页，由于硬盘连接在南桥，读取速度和频率较慢，这会产生严重的服务器延迟（比如一个硬盘最高一次只能进行10万次的数据输出，那么剩下的九十万用户就得等着），这是非常搞糟的体验。因此，现在的服务器很多都采用了固态硬盘，并将硬盘直接连接在北桥上，以获取更高的读取性能。

　　6.主频和缓存

　　主频可以理解为CPU的计算能力，主频越大，CPU在单位时间的计算能力越强。CPU的频率可以达到1GHZ，而内存的读取速度远远低于CPU的频率。由于木桶原理，即使CPU的速度再高，内存的读取效率跟不上，计算机的整体性能也难以提高。为此我们可以造更快的内存，但是这种方式造价极高。于是出现了缓存技术，缓存技术是在速度和造价之间的择中原则。

　　速度越快的部件，造价越高。因此最快的核心部件，我们只要一小块，然后在其外围放性能稍低（相对于核心）造价也稍低的设备，这就是缓存。CPU有一级缓存，二级缓存...缓存在CPU和内存之间起到了承上启下的作用。

　　缓存的工作，需要遵循程序的局部性原理，程序的局部性原理分为时间局部性和空间局部性。
- 时间局部性：刚刚访问的数据可能还会被访问，那么将该数据需要被缓存。
- 空间局部性：如果访问一个数据，那么离这个数据非常近的数据，也应该访问的比较快。因此在访问一个数据的时候，把其周围的数据也一并载入进来，这样就提高了其周围数据的访问速度。
　　程序的局部性原理，不仅应用在CPU的工作上，也用在码农的编码过程中，运用时间局部性和空间局部性，可以显著提高程序的运行效率。

　　举例：
- Javascript中访问内层变量比访问全局变量快得多，因此我们在编码的过程中尽量少的依赖全局变量，可以提高运行的效率。（克制使用全局变量的好处不仅这一处，这里简单的举例说明）。
- for循环中缓存变量，操作数据库的时候缓存字段等。
　　7.机器码，汇编，高级语言

　　我们知道所有程序必须要编译机器码（二进制）才能被计算机识别和执行，我们也知道汇编是对机器码的抽象，让我们不用直面枯燥难懂的机器码，而使用易于人类理解的语言进行编程。汇编语言也叫作微码，是CPU厂商为我们暴露出来（可以理解为接口），通过微码我们可以进行针对CPU的编程。需要注意的是，不同的CPU架构不同，对于同一操作，其暴露出的微码也不尽相同。因此针对不同的CPU，我们需要分别对他们进行编程。尽管有些许蛋疼，但总比使用机器码编程好太多了。

　　高级语言是对汇编语言更高一层的抽象，结合一些额外的机制，来弥合CPU之间的不同。然后暴露出公共的API程序员调用，尽管对于这份API，其在不同的平台下可能会进行不同的实现，但是对于程序员，我们只需调用这个API，就可以实现平台的兼容，而我们自己再也不用考虑硬件的差异性了。

　　8.CPU的架构

　　下面是一些常见的架构：　
- ARM：手持硬件设备（安卓，IOS）
- x86：32位平台
- x64：64位，来自AMD
- 安腾：来自惠普，Intel收购
- Alpha：惠普
- UltraSparc：SUN公司
- Power：IBM
- M68000：摩托罗拉（M68K）
- PowerPC ：IBM
　　9.CPU怎么执行一个程序

　　单核的CPU，在某个时刻只能进行一次运算，为什么我们的程序看上去是并行执行呢？

　　这里需要引入切割机制，切割机制可以分为CPU切割和内存切割。

　　CPU切割：把CPU按照时间片（Slice）切割。比如一个Slice是5ms，那么每个程序只能运行5ms，下一个5ms就该换一个程序运行了（当然也可能仍然运行这个程序，具体取决于CPU的分配机制）。同时，CPU还应该有一个机制来记录程序的运行状态，以便程序在下一次运行的时候可以从先前的状态继续执行。

　　内存切割：引入分段机制，想象两个程序同时运行，而且都从内存的某一个编号开始占用（比如0x00000），那么后面的程序就会破坏掉前面程序的数据。现在引入了内存分段的机制，将内存分为一块块的区域，这些区域内部都从0x00000开始，那么程序就不会相互干扰了。

　　10.操作系统

　　上例中，怎么保证每个程序在每个时间片中程序都是严格执行呢？如果程序赖着不走怎么办？

　　这就需要引入操作系统了，操作系统就是用来对程序进行调度，以及协调其他程序进行工作，是位于硬件和应用软件之间的中间层。有了操作系统，任何程序都不能直接和硬件打交道，而是要经过操作系统这一中间层进行处理。

　　同一份程序，在不同的操作系统运行的效果不同的解释：程序要执行某一个功能，将请求交给操作系统，操作系统通过调用相关的库来执行，不同的操作系统实现实现某种库的方式可能不一样，那么程序的效果也就不一样了。

　　11.Shell

　　以Windows为例，为什么双击桌面上的图标就可以运行相应的程序，或则在命令行中输入calc就可以打开计算器呢？

　　上面的两种操作：双击图标和在命令行输入命令回车，本质上都是指令。我们的指令需要操作系统传到内核（kernel）中，然后实现程序的运行。接收指令的这个东东，就是人机交互接口（Shell）。Shell包括两种：
- GUI图形Shell
- CLI命令行Shell
　　不管是GUI还是CLI，目的都是向内核传送指令，实现某项操作，对于内核来说，通过什么方式传送指令并不重要。

　　操作系统内核的功能包括：　
- 进程管理（协调）
- 内存管理
- 文件系统
- 网路功能
- 硬件驱动
- 安全机制等
　　12.Linux发行版

　　终于讲到Linux了，照例在此之前应该讲讲Linux的起源，Unix，Bell实验室，Apple和Windows等等，但是历史性的东西并不是这篇博文的重点，这里就暂且跳过。

　　Linux是操作系统，也就是软件，软件要想运行，就需要编译成相应的二进制代码才能运行。

　　上面我们也谈到过，不同的CPU架构，完成某项操作的实现方式可能不同，因此在编译操作系统的时候不应该出现交叉编译的情况（比如在AMD上编译在Intel上运行）。

　　也就是说，想要在某个平台上使用操作系统，需要针对这个平台进行编译。这无疑增加了学习和使用的难度，作为初学者而言，这是噩梦。于是出现了一些组织，他们来对Linux的源码和外围的一些软件进行编译集成，然后发行出来，这就是Linux的发行版。这样的公司或组织有RedHat，Debian等。

　　13.软件包管理器

　　早期的软件都是随着内核一起打包发布的，这样有个明显的缺点：不利于软件的管理，如软件的安装，卸载等。于是出现了软件包管理器，用来方便软件的管理，安装，卸载等。比较著名的有dpt（debian），rpm（redhat）等。

　　14.Linux的基本原则
- 组装：组合功能目的单一的小程序，完成复杂的任务
- 一切皆文件
- 尽量避免捕获用户接口（交互），比如输入ls，马上列出目录下的文件，不需要其他操作。
- 配置文件保存为纯文本格式——一个简单的文本编辑器就可以完成所有的功能。
　　15.命令的构成

　　基本格式为：命令 = 命题主体 + 选项 + 参数。

　　命令执行：输入命令后，由shell将指令发送给kernel，kernel即对该指令进行判断，决定是否执行。

　　命令可以跟上选项，用来修正命令的执行方式。格式为：
- 短选项：-单一字符，如 -a，-l，-h
- 长选项：--单词，如 --help
　　短选项多个选项可以组合：-a -h 可以组合成 -ah。长选项通常不能组合。

　　命令的参数：命令的表示命令的作用对象。如：ls -ah /etc 为列出 /etc 目录下的文件，如果不加参数，默认为当前目录。

　　16.一些琐碎知识

　　Linux（我这里使用的是RedHat）下一般有6个终端可以使用，可以按键盘组合键 ctrl + alt + f1~f6切换。

　　$ startx & -> 启用图形界面。

　　Linux图形界面的类型：Gnome（C），KDE（C++），XFace（轻量级图形界面）。

　　Linux命令行界面类型：bash csh zsh ksh....

　　任何跟shell相关的启动的程序，只要shell关了，这个程序也就关了（这不废话吗）。

　　su：切换用户（switch user 缩写）。

　　su root [-l] ：半切换，完全切换。

　　passwd：修改密码，连输两次即可。

　　对于root，可以随便修改，对于普通用户，需要满足密码复杂性规则。

　　17.总结

　　这篇文章主要介绍了CPU和操作系统的简单工作原理，涉及到的概念有：运算器，控制器，寄存器，总线，南北桥，操作系统，shell等。算是对基础知识的一些总结，由于没有深刻学习，文章中有很多漏洞，更有许多模糊的知识没有加以说明。文章组织不够严谨，只是单纯的将知识点分条罗列，逻辑性有待加强。

　　就以这篇文章开始，一步步打开Linux的大门吧。

作者：Charleylla　　转载请注明出处：http://www.cnblogs.com/charleylla/p/5967255.html
相关阅读:
获取Mysql-jdbc驱动Driver类的两种方式
 Misha and Changing Handles
What Are You Talking About （map）
Let the Balloon Rise <map>的应用
 ignitius and princess 2(全排列）
大一下学期计划
 大一上学期总结
 algorithm的基本注意事项
 STL的注意事项
 STL的基本操作指令
原文地址：https://www.cnblogs.com/charleylla/p/5967255.html

[Linux 001]——计算机和操作系统的基础知识

1.程序的构成

2.CPU的简单理解

3.中断机制（Interrupt）

4.中断控制器

5.南桥和北桥

6.主频和缓存

7.机器码，汇编，高级语言

8.CPU的架构

9.CPU怎么执行一个程序

10.操作系统

11.Shell

12.Linux发行版

13.软件包管理器

14.Linux的基本原则

15.命令的构成

16.一些琐碎知识

17.总结

　　1.程序的构成

　　2.CPU的简单理解

　　3.中断机制（Interrupt）

　　4.中断控制器

　　5.南桥和北桥

　　6.主频和缓存

　　7.机器码，汇编，高级语言

　　8.CPU的架构

　　9.CPU怎么执行一个程序

　　10.操作系统

　　11.Shell

　　12.Linux发行版

　　13.软件包管理器

　　14.Linux的基本原则

　　15.命令的构成

　　16.一些琐碎知识

　　17.总结