• IO 模型


    转载链接:https://mp.weixin.qq.com/s/m1nK32og0DlWyp1rMhPbiA

    在学习 Netty 框架前有一个话题是无法绕过的,就是:网络编程 IO 模型,听见 IO 模型有些同学就开始背八股文了,Java 常见 IO 模型有:

    • 同步阻塞 BIO
    • 同步非阻塞 NIO
    • 异步非阻塞 AIO

    今天跟大家一起重温下这些知识点。

    Socket 网络编程

    网络编程中有一个重要的概念就是:Socket,我们简单了解一下。

    在网络通信中,客户端和服务端通过一个双向的通信连接实现数据的交换,连接的任意一端都可称为一个 Socket

    Talk is cheap, show me the diagram,Socket 网络通信基本过程如下图所示:

    图片

    总结一下流程,可以简单描述为这四步:

    • (1)服务端启动,监听指定端口,等待客户端连接;

    • (2)客户端尝试与服务端连接,建立可信数据传输通道;

    • (3)客户端与服务端进行数据交换;

    • (4)客户端或者服务端断开连接,终止通信;

    了解了基本流程,有些小伙伴可能对 Socket 这玩意很感兴趣了,Socket 到底是什么东西呢?Socket 中文翻译过来就是套接字,是网络通信对象的抽象表达,听起来还是很模糊,从编码者视角来看,本质上就是一套编程接口,是对复杂的 TCP/IP 协议进行封装供上层应用使用,这样总明白了吧。

    那 Socket 对象一般包括什么东西呢?一般包括五种信息:连接使用的协议本地主机的IP地址本地进程的协议端口远端主机的IP地址远端进程的协议端口。从这里可以看到 Socket 包含的信息非常丰富,也就是说拿到一个 Socket 对象就相当于知己知彼了。

    传统 BIO 模式

    上面小节从理论角度讲解了什么是Socket,现在我们回到开发语言实现层面上来,以 Java 为例,Java 语言从 1.0 版本就已经封装了 Socket 相关的接口供开发者使用,对这部分代码感兴趣的小伙伴可以出门向左拐,在java.net 包下面查看源码。

    我们尝试用一个 demo 来演示一下传统的网络编程:

    服务端代码:

    public static void main(String[] args) throws IOException {
            // 创建一个ServerSocket,监听端口8888
            ServerSocket ss = new ServerSocket(8888);
            
            // 循环方式监听客户端的请求
            while (true) {
                // 这里一直会阻塞,直到客户端连接上
                Socket socket = ss.accept();
    
                // 输入流用于接收消息
                InputStream inputStream = socket.getInputStream();
                BufferedInputStream bufferedInputStream = new BufferedInputStream(inputStream);
                
                // 输出流用于回复消息
                OutputStream outputStream = socket.getOutputStream();
                final PrintStream printStream = new PrintStream(outputStream);
    
                // 循环接收并回复客户端发送的消息
                byte[] bytes = new byte[1024];
                int len;
                while ((len = bufferedInputStream.read(bytes)) != -1) {
                    printStream.print("服务端收到:" + new String(bytes, 0, len));
                }
            }
        }

    效果演示:

    服务端运行起来后,使用 telnet 命令来模拟客户端发送消息:

    telnet 127.0.0.1 8888

    客户端每发送一条消息,服务端都会回复,演示效果如下:

    图片

    仔细想一下,上面的代码可能会有问题,如果前面一个客户端一直不断开,服务端就不能处理其他客户端的消息了,也就是说程序不具备并发的能力。

    我们稍加改造一下,将前面的处理逻辑代码全部抽取到一个新的handle()方法, 每当有客户端连接上就新开一个线程处理:

    public static void main(String[] args) throws IOException {
        // 创建一个ServerSocket,监听端口8888
        ServerSocket ss = new ServerSocket(8888);
    
        // 循环方式监听客户端的请求
        while (true) {
            // 这里一直会阻塞,直到客户端连接上
            Socket socket = ss.accept();
            // 启动一个新的线程处理
            new Thread(() -> handle(socket)).start();
        }
    }

    这里为了演示方便直接新起了一个线程,当然更好的办法是用线程池,但是也解决不了根本性问题。

    看了两段代码,先简单总结一下 BIO 模式的劣势:

    • 如果 BIO 使用单线程接收连接,则会阻塞其他连接,效率较低。
    • 如果使用多线程,虽然减弱了单线程带来的影响,但当有大并发进来时,会导致服务器线程太多,压力太大而崩溃。
    • 就算使用线程池,也只能同时允许有限个数的线程进行连接,如果并发量远大于线程池设置的数量,还是与单线程无异。
    • IO 代码里 read 操作是阻塞操作,如果连接不做数据读写操作会导致线程阻塞,就是说只占用连接,不发送数据,则会浪费资源。比如线程池中 500个连接,只有 100 个是频繁读写的连接,其他占着茅坑不拉屎,浪费资源!
    • 另外多线程也会有线程切换带来的消耗。

    综上所述,BIO 模式不能满足大并发业务场景,仅适用于连接数目比较小且固定的架构。

    同步阻塞 BIO 模式

    根据上面的例子我们再画图抽象一下 BIO 网络编程场景:

    图片

    传统 BIO 的特点是只要来了一个新客户端连接,服务端就会开辟一个线程处理客户端请求,但是客户端连接后并不是一直都对服务端进行 IO 操作,这样会导致服务端阻塞,一直占用着线程资源,造成很多非要的开销。

    为了解决这个问题,Java 引入了 NIO,我们接着往下看。

    NIO

    在 Java 1.4 版本之前 BIO 是开发者唯一的选择,1.4 版本开始引入了 NIO 框架。

    NIO 的 N 有两层含义,一层是:New IO,另一层是 Non Blocking IO。

    「New」是相对于传统 BIO 来说的,在当时确实挺新的;Non Blocking IO 又被称为:同步非阻塞 IO,同步非阻塞体现在:

    • 同步:调用的结果会在本次调用后返回,不存在异步线程回调之类的。
    • 非阻塞:表现为线程不会一直在等待,把连接加入集合后,线程会一直轮询集合中的连接,有则处理,无则继续接受请求。

    NIO 三大基础组件

    学习 NIO必须得知道下面这三个基础组件:

    (1)Buffer(缓冲区)

    IO 是面向流(字节流或者字符流)的,而 NIO 是面向的,指的是 Buffer 缓冲区。面向块的方式一次性可以获取或者写入一整块数据,而不需要一个字节一个字节的从流中读取,这样处理数据的速度会比流方式更快。

    Buffer 缓冲区的底层实现是数组,根据数组类型可以细分为:ByteBuffe、CharBuffer、DoubleBuffer、FloatBuffer、IntBuffer、LongBuffer、ShortBuffer等。

    (2)Channel(通道)

    Channel 翻译成中文是通道的意思,作用类似于 IO 中的 Stream 流。但是 Channel 和 Stream 不同之处在于 Channel 是双向的,Stream 只是在一个方向移动,而且 Channel 可以用于读、写或者同时用于读写。

    常见 Channel 通道类型:

    • FileChannel 用于文件操作场景;
    • ServerSocketChannel 和 SocketChannel 主要用于 TCP 网络通信 IO,这是本文的重点;
    • DatagramChannel: 从 UDP 网络中读取或者写入数据。

    Channel 与 Buffer 之间的关系:

    每个 Channel 对应一个 Buffer 缓冲区,永远无法将数据直接写入到Channel或者从Channel中读取数据。需要通过Buffer与Channel交互。

    (3)Selector(多路复用器)

    NIO 服务端的实现模式是把多个连接(请求)放入集合中,只用一个线程可以处理多个请求(连接),也就是多路复用,Linux 环境下多路复用底层主要用的是内核函数(select,poll)来实现的,为了提升效率,Java 1.5 版本开始使用 epoll。

    关于 select、poll、epoll 之间的对比,感兴趣的小伙伴可以自行上网查询。

    在 NIO 中多路复用器我们称之为:Selector,Channel 会注册到 Selector 上,由 Selector 根据 Channel 读写事件的发生将其交由某个空闲的线程处理。

    Buffer、Channel、Selector 这三个组件的之间的关系可以用下面的图来描述:

    图片

    基本的工作流程如下:

    (1)首先将 Channel 注册到 Selector 中;

    (2)初始化 Selector,调用 select() 方法,select 方法会阻塞直到感兴趣的事件来临;

    (3)当某个 Channel 有连接或者读写事件时,该 Channel 就会处于就绪状态;

    (4)Selector 开始轮询所有处于就绪状态的SelectionKey,通过 SelectionKey 可以获取对应的Channel 集合;

    NIO 比 BIO 好用在哪?

    NIO 相对于 BIO 最大的改进就是使用了多路复用技术,用少量线程处理大量客户端 IO 请求,提高了并发量并减少了资源消耗;

    另外NIO 的操作时非阻塞的,比如说,单线程中从通道读取数据到buffer,同时可以继续做别的事情,当数据读取到buffer中后,线程再继续处理数据。写数据也是一样的。

    NIO 存在的问题

    NIO这么牛了,是不是就是终极解决方案了?其实也不是,NIO 也存在很多问题。

    我们来看看 NIO 有哪些问题?

    (1)NIO 的 API 使用起来非常麻烦,门槛比较高,开发者需要熟练掌握:Selector、ServerSocketChannel、SocketChannel、ByteBuffer 等类。

    (2)NIO 编程涉及到 Reactor 模式,开发者需要对多线程和网络编程非常熟悉才能写出高质量的 NIO 程序;

    (3)异常场景处理麻烦,比如:客户端断连重连、网络闪断、拆包粘包、网络拥塞等等;

    (4)NIO 有 bug,不稳定,比如:臭名昭著的 Epoll bug,会导致 Selector 空轮询,最终导致 CPU 100%。

    NIO 问题这么多,有些开发者终于不能忍了,最终 Netty 框架横空出世。

     

  • 相关阅读:
    Delphi中Android运行和JNI交互分析
    C++ 中内存分配和回收
    Delphi Android程序启动过程
    Delphi XE的RTTI增强,动态Hook某些内部事件
    Win7下超级管理员创建普通权限任务
    再探Delphi2010 Class的构造和析构顺序
    Delphi2010新发现-类的构造和析构函数功能
    【背包专题】01背包
    Delphi2010的RTTI增强
    用WebBrowser实现HTML界面的应用和交互 good
  • 原文地址:https://www.cnblogs.com/blogtech/p/16249603.html
Copyright © 2020-2023  润新知