Linux IO模式和select，poll，epoll解释

Linux IO模式和select，poll，epoll解释

一些概念：

虚拟空间：是进程所看到的所有地址组成的空间。虚拟空间某个进程对所有分配给它的所有物理地址的重新映射。

寻址返回与计算机的位数有关系。分为内核空间与用户空间。针对32位的Linux系统，最高的1G字节为内核空间。最低的3G字节为用户空间。

进程阻塞：这是进程自身的一种主动行为。当进程进入阻塞状态的时候，不占用CPU资源。

文件描述符fd：非负整数，是一个索引值。指向内核为每一个进程所维护的该进程的打开文件记录表。

缓存IO：大多数文件系统的默认IO都是缓存IO。过程是：数据先被拷贝到操作系统的内核缓冲区（页缓存 page cache）中，然后再拷贝到应用程序的地址空间。

举例：

当一个read操作发生时，会经历两个阶段：

1 等待数据准备(waiting for the data to be ready)

2 将数据从内核拷贝到进程中(copying the data from the kernel to the process)

LInux IO模式分为5种：

阻塞IO(blocking IO)

非阻塞IO(non-blocking IO)

IO多路复用(IO multiplexing)

信号驱动IO(signal driven IO) (不常用)

异步IO(asynchronous IO)

阻塞IO(blocking IO)：

在Linux中，默认情况下，所有的socket都是blocking的。图示如下：

上面提到了两个阶段，再blocking IO里，两个阶段都被阻塞了

非阻塞IO（nonblocking IO）

图示如下：

nonblocking IO的特点是用户进程需要不断的主动询问kernel数据准备好了没有

IO多路复用（IO multiplexing）

也称为event driven IO，包括select，poll，epoll。单个进程可以同时处理多个网络连接的IO。

原理是select，poll，epoll会不断轮询所负责的socket，当socket有数据到达了，会通知用户进程

图示如下：

用户进程调用了select，整个进程会被block。同时kernel会监视所有select负责的socket，当任何一个socket中的数据准备好了，select就会返回。这个时候再调用read，将数据从kernel拷贝到用户进程

在这里，我们使用了select，recvfrom两个system call，相比较blocking IO的一个system call（recvfrom）效率更差，使用select的优势在于它可以同时处理多个connection，而不是对于单个连接处理的更快。

所以，当要处理的连接数不是很高的话，使用select/epoll的web server不一定比使用multi-threading + blocking IO的web server性能更好，可能延迟更大。

在IO multiplexing model里，对于每一个socket，一般都设置成non-blocking的。大多数情况下，整个用户的process被select函数所阻塞

异步IO（asynchronous IO）

异步IO的流程如下：

用户进程发起read之后立即返回，去做其他的事情。

kernel收到read之后，不会对用户进程产生任何block。而是等待数据准备完成，将数据拷贝到用户内存，然后给用户进程发送一个signal，告诉read操作完成了

总结：

blocking和non-blocking的区别

调用blocking IO会一直block住对应的进程直到操作完成，而non-blocking IO在kernel还准备数据的情况下立即返回

syschronous IO和asynchronous IO的区别

判断同步IO，异步IO的关键点在于在真实的IO操作里（比如recvfrom），进程有没有被阻塞。

在non-blocking中，如果kernel的数据没有准备好，这时候固然不会block进程。但是当kernel中数据准备好的时候，recvfrom会将数据从kernel拷贝到用户内存里，这时候进程是被block的，所以non-blocking，blocking均是同步IO

而异步IO是当进程发起IO操作之后，立即返回，再也不理睬，知道收到kernel发送的IO完成的信号。在这个过程中，进程完全没有被block

同步异步的区分点在于：用户进程是怎样知道数据ok了的（自己主动check得知，还是接收到的signal得知）；数据在kernel中准备完成之后，是谁负责拷贝数据到用户内存的（自己拷贝还是kernel负责拷贝的）

各个IO model的比较图：

本文从以下ref中整理而来：

ref: https://segmentfault.com/a/1190000003063859
相关阅读:
算法提高 11-2删除重复元素
 Codeforces 402 D Upgrading Array
Codeforces 351B Jeff and Furik
湖南多校对抗赛（2015.03.28） I Inversion Sequence
湖南多校对抗赛（2015.03.28） H SG Value
湖南多校对抗赛（2015.03.28） G Good subsequence
湖南多校对抗赛（2015.03.28） E Longest Increasing Subsequence Again
湖南多校对抗赛（2015.03.28） B Design road
湖南多校对抗赛（2015.03.28） A Rectangle
Codeforces 515D Drazil and Tiles
原文地址：https://www.cnblogs.com/geeklove01/p/8979760.html