1.1 I/O 基础入门
Java1.4 之前的早期版本,对 I/O 的支持存在如下问题:
- 没有数据缓冲区,I/O 性能存在问题;
- 没有 C 或者 C++ 中的 Channel 概念,只有输入和输出流;
- 同步阻塞式 I/O 通信(BIO),通常会导致通信线程被长时间阻塞;
- 支持的字符集有限,硬件可移植性不好。
1.1.1 Linux 网络 I/O 模型
根据 UNIX 网络编程对 I/O 模型的分类,UNIX 提供了 5 种 I/O 模型:
- 阻塞 I/O(blocking I/O)
- 非阻塞 I/O(nonblocking I/O)
- I/O 复用(I/O multiplexing (select and poll))
- 信号驱动 I/O(signal driven I/O (SIGIO))
- 异步 I/O(asynchronous I/O (the POSIX aio_ functions))
对于一个套接口上的输入操作,通常包括2个阶段:
- 等待数据准备就绪。等待数据从网络中到达,当包到达时,它被复制到内核缓冲区。
- 数据从内核复制到用户空间。将数据从内核缓冲区复制到应用进程缓冲区。
(1)阻塞 I/O 模型
最常用的 I/O 模型就是阻塞 I/O 模型,缺省情形下,所有文件操作都是阻塞的。我们以套接字接口为例来讲解此模型:在进程空间中调用 recvfrom,其系统调用直到数据包到达且被复制到应用进程的缓冲区中或者发生错误时才返回,在此期间一直会等待,进程在从调用 recvfrom 开始到它返回的整段时间内都是被阻塞的,因此被称为阻塞 I/O 模型。
(2)非阻塞 I/O 模型
recvfrom 从应用层到内核的时候,如果该缓冲区没有数据的话,就直接返回一个 EWOULDBLOCK 错误,一般都对非阻塞 I/O 模型进行轮询检查这个状态,看内核是不是有数据到来。
(3)I/O 多路复用模型
Linux 提供 select/poll,进程通过将一个或多个 fd 传递给 select 或 poll 系统调用,阻塞在 select 操作上,这样 select/poll 可以帮我们侦测多个 fd 是否处于就绪状态。select/poll 是顺序扫描 fd 是否就绪,而且支持的 fd 数量有限,因此它的使用受到了一些制约。Linux 还提供了一个 epoll 系统调用,epoll 使用基于事件驱动方式代替顺序扫描,因此性能更高。当有 fd 就绪时,立即回调函数 rollback。
(4)信号驱动 I/O 模型
首先开启套接口信号驱动 I/O 功能,并通过系统调用 sigaction 执行一个信号处理函数(此系统调用立即返回,进程继续工作,它是非阻塞的)。当数据准备就绪时,就为该进程生成一个 SIGIO 信号,通过信号回调通知应用程序调用 recvfrom 来读取数据,并通知主循环函数处理数据。
(5)异步 I/O 模型
告知内核启动某个操作,并让内核在整个操作完成后(包括将数据从内核复制到用户自己的缓冲区)通知我们。这种模型与信号驱动模型的主要区别是:信号驱动 I/O 由内核通知我们何时可以开始一个 I/O 操作;异步 I/O 模型由内核通知我们 I/O 操作何时已经完成。
5种 I/O 模型比较
1.1.2 I/O 多路复用技术
在 I/O 编程过程中,当需要处理多个客户端接入请求时,可以利用多线程或者 I/O 多路复用技术进行处理。I/O 多路复用技术通过把多个 I/O 的阻塞复用到同一个 select 的阻塞上,从而使得系统在单线程的情况下可以同时处理多个客户端请求。与传统的多线程/多进程模型比,I/O 多路复用的最大优势是系统开销小,系统不需要创建新的额外进程或者线程,也不需要维护这些进程和线程的运行,降低了系统的维护工作量,节省了系统资源。
I/O 多路复用的主要应用场景如下:
- 服务器需要同时处理多个处于监听状态或者多个连接状态的套接字;
- 服务器需要同时处理多种网络协议的套接字。
目前支持 I/O 多路服用的系统调用有 select、pselect、poll、epoll,在 Linux 网络编程过程中,很长一段时间都使用 select 做轮询和网络事件通知。为了克服 select 的缺点,epoll 作了很大的改进:
- 支持一个进程打开的 socket 描述符(FD)不受限制(仅受限于操作系统的最大文件句柄数)。
- I/O 效率不会随着 FD 数据的增加而线性下降。
- 使用 mmap 加速内核与用户空间的消息传递。
- epoll 的 API 更加简单。包括创建一个 epoll 描述符、添加监听时间、阻塞等待所监听的事件发生、关闭 epoll 描述符等。
注:epoll 是 Linux 内核为处理大批量文件描述符而作了改进的 poll,是 Linux 下多路复用 IO接口 select/poll 的增强版本,它能显著提高程序在大量并发连接中只有少量活跃的情况下的系统 CPU 利用率。
2. Java 的 I/O 演进
从JDK1.0 到 JDK1.3,Java 的 I/O 类库都非常原始,很多 UNIX 网络编程中的概念或者接口在 I/O 类库中都没有体现,例如 Pipe、Channel、Buffer 和 Selector 等。
2002年发布的 JDK1.4 时,NIO 以 JSR-51 的身份正式随 JDK 发布。它新增了个 java.nio 包,提供了很多进行异步 I/O 开发的 API 和类库,主要的类和接口如下:
- 进行异步 I/O 操作的缓冲区 ByteBuffer 等;
- 进行异步 I/O 操作的管道 Pipe;
- 进行各种 I/O 操作的 Channel,包括 ServerSocketChannel 和 SocketChannel;
- 多种字符集的编解码能力;
- 实现非阻塞 I/O 操作的多路复用器 selector;
- 基于流行的 Perl 实现的正则表达式类库;
- 文件通道 FileChannel。
2011年7月28日,JDK1.7 正式发布,将原来的 NIO 类库进行了升级,被称为 NIO2.0。主要包括如下三个方面的改进:
- 提供能够批量获取文件属性的 API,这些 API 具有平台无关性。提供了标准文件系统的 SPI,供各个服务提供商扩展实现;
- 提供 AIO 功能,支持基于我呢见的异步 I/O 操作和针对网络套接字的异步操作;
- 完成 JSR-51 定义的通道功能,包括对配置和多播数据报的支持等。