本篇文章参考自并发编程网
一、NIO 的概述
NIO 由以下几个核心组成
- Channels
- Buffers
- Selectors 选择器用于监听多个通道的事件(如:链接打开、数据达到),单个线程可以监听多个数据通道。
传统的 IO 基于字节流和字符流操作,而 NIO 基于 Channel 和 Buffer 操作,数据总是从通道读取到缓冲区,或从缓冲区写入到通道中。NIO 可以非阻塞的使用,如:当线程从通道读取数据到缓冲区时,线程还是可以进行其他事情的。当数据被读取到缓冲区后,线程可以继续处理它。从缓冲区写入通道也类似。
1 Channel
Channel 有点像流,流是单向的,但它是双向的,数据可以从后 Channel 读取到 Buffer 中,也可以从 Buffer 写入到 Channel 中。关于 Channel 有以下几种
- FileChannel
- SocketChannel //通过 TCP 读写网络中的数据
- ServerSocketChannel //监听 TCP 链接,对于每个新进链接都会创建一个 SocketChannel
- DatagramChannel //通过 UDP 读写网络中的数据
1.1 FileChannel
FileChannel 是一个读、写、映射、操作文件的通道。可通过 FileInputStream、FileOutputStream、RandomAccessFile 的 getChannel() 方法获取文件通道的对象,这个文件通道被连接到相同的底层文件。通过 FileInputStream 获取到的文件通道是只读的,通过 FileOutputStream 获取到的文件通道是只写的,另外通过 RandomAccessFile 获取的文件通道可以指定读写方式。
FileChannel 中的部分方法
- read() //可以将数据读取到 Buffer 中,返回有多少字节被读取到。
- write() //传入一个 Buffer ,将其数据写入 FileChannel。
- size() //返回所关联文件大小
- position(long pos) //设置当前读取位置
- truncate() //截取一个文件,指定长度后面的部分将被删除
- force() //将通道中尚未写入磁盘的数据强制写到磁盘上。
- transferTo() //方法可以将数据从 FileChannel 传输到其他 Channel 中。
1.2 SocketChannel
SocketChannel 是一个连接到 TCP 网络套接字的通道。其创建方式有两种:通过调用 open() 方法或者是ServerSocketChannel 获取链接后创建。
我们可以将 configureBlocking(boolean) 方法的值设为 false 使 SocketChannel 成为非阻塞模式,设置之后就可以在异步模式下调用 connect()、read() 和 write() 了。在非阻塞模式下 read() 方法有可能在尚未读取到任何数据时就返回了,所以需要关注它的返回值来确定读取了多少字节。在非阻塞模式下 write() 方法在未写出内容时可能就已经返回,所以需要在循环中调用 write()。
1.3 ServerSocketChannel
ServerSocketChannel 是用来监听 TCP 链接通道的,与 ServerSocket 一样。通过 open() 方法可以创建其对象。通过 accept() 方法来监听新链接。我们可以利用 configureBlocking(boolean) 方法将其设为非阻塞模式,在此模式下 accept() 会立刻返回,如果还没有新链接进来返回的将是 null。
1.4 DatagramChannel
DatagramChannel 是一个能收发 UDP 包的通道。其 receive() 方法会将接收到的数据包内容复制到指定的 Buffer,如果 Buffer 容不下这些数据,多出的数据则会被丢弃。通过 send() 方法可以发送数据。
2 Buffer
Buffer 用于和 NIO 通道进行交互,缓冲区本质上是一块可以写入数据、读取数据的内存。
关于 Buffer 读写数据一般遵循以下四个步骤
- 分配空间(ByteBuffer buf = ByteBuffer.allocate(1024);)
- 写入数据到 Buffer(int reads = fileChannel.read(buf);)
- 调用 flip() 方法切换到读模式(buf.flip();)
- 从 Buffer 中读取数据(buf.get();)
- 调用 clear() 方法或 compact() 方法
写入数据时,Buffer 会记录下写了多少数据。读取数据,通过 flip() 方法将“写模式”切换到“读模式”后,可以读取之前写入到 Buffer 的数据。当读取完所有数据后,需要调用 clear() 方法或 compact() 方法清空缓冲区,让它可以被再次写入。clear() 方法会清空整个缓冲区,compact() 方法只会清除已经读过的数据,且未读的数据都被移到缓冲区的起始处,新写入的数据将放置在未读数据后面。
缓冲区本质时一块可以写入数据、读取数据的内存,这块内存被包装成 NIO Buffer 对象,并提供了一组方法,来方便访问该内存。我们来看一下 Buffer 中的三个属性:capacity (缓冲区总大小)、position (写数据时的位置)、limit (能读到多少数据)、mark(记录当前position的前一个位置)。
当我们通过 ByteBuffer.allocate(11) 方法创建了长度为11的 byte 的数组缓冲区,初始状态如下图
当我们写入5个字节后,变化如下图所示
当我们需要将缓冲区的5个字节写入到 Channel 的通信信道时,我们调用 ByteBuffer.filp() 方法,position 变为0,并将 limit 为之前 position 的值,变化如下图
关于 Buffer 有以下几种
- ByteBuffer
- MappedByteBuffer
- CharBuffer
- DoubleBuffer
- FloatBuffer
- IntBuffer
- LongBuffer
- ShortBuffer
3 Selector
Selector 允许单个线程处理多个 Channel。如果应用打开了多个链接(通道),但每个链接的流量都很低,使用 Selector 就会很方便,例如在一个聊天服务器中。
我们通过 Selector.open() 方法可以创建一个 Selector,然后将 Channel 注册到 Selector 上。