• Ngnx工作原理(1)


    Nginx 是一个轻量级的HTTP 服务程序,相比其他服务器程序如Apache,Nginx占用内存少,稳定性高,并发处理能力强。同时Nginx 还是一个反向代理服务程序,和邮件代理服务程序。Nginx具有丰富的模块库、灵活的配置、较低资源消耗等优点。下面,我们一起深入看一下Nginx的工作机制

    1. Nginx 如何实现高性能低消耗的呢?

    我们从以下几个方面说明以下:

    网络事件处理机制
    • Nginx 采用异步非阻塞的方式处理请求,可以同时处理上万的请求

    • Nginx 支持 select/epoll 等流行事件处理机制,根据系统环境自动选择

    • Nginx 采用独立于系统的事件处理机制,能够高效处理请求

    资源分配技术
    • Nginx 采用分阶段资源分配技术,使得它的CPU和内存消耗非常低

    多核处理优化
    • Nginx 默认采用多进程启动模式

    • Nginx 包含Master 进程 和 Worker 进程

    • 能够充分利用 SMP 对称多处理的优势,减少Worker进程磁盘I/O的阻塞

    • Nginx 支持Worker进程和CPU内核 一一对应绑定,避免进程上下文的切换致使cache失效
      基于上面提到技术,以及Nginx很多地方的优化,让Nginx成为最快的HTTP服务器。

    2.Nginx的进程模型

    在Nginx的技术架构中,进程模型是至关重要的一部分。接下来,我们一起看看Nginx进程模型,以及它们的工作机制。

    Linux 系统中,Nginx默认以守护进程daemon方式启动,默认采用多进程方式。Nginx包括两种类型的进程:

    • Master 进程,数量只有一个,管理Nginx本身和Worker进程

    • Worker 进程,数量一般和CPU核数相等,Nginx的所有请求处理,均是在Worker进程中完成

    下面,我们分别深入看一下Master和Worker进程。

    2.1 Master 进程工作机制

    在Nginx启动时,Master进程创建,主要负责初始化Nginx和相关模块、fork Worker进程、接收处理外界信号等工作。

    Nginx的初始化过程:

    • 解析配置文件,这是Nginx初始化最重要的一个环节

    • 调用各个配置指令回调函数,完成各个模块的配置、相互关联等

    • 建立listen 的 socket(listenfd)

    • 准备工作都完成后,fork worker子进程和cache子进程
      Master 进程信号处理机制
      我们通过kill命令发送信号给Nignx Master 进程,看看Master进程如何处理:

    分析流程:

    • Master 进程接收到 HUP 信号

    • Master 进程重新加载配置文件

    • Master 进程启动新的Worker进程

    • Master 进程发送信号给Worker 进程

    • 老的Worker进程不再接收新的请求

    • 老的Worker进程处理完当前请求,退出

    • 至此,Nginx完成平滑重启

    注意:Nginx 0.8 版本以后,提供了 -s参数,用于管理Nginx服务的停止和重启,注意line 11:

     
    2.2 Worker 进程工作机制

    Worker进程负责所有请求的处理工作,我们通过一个HTTP请求,来梳理一下Worker的工作流程:

    • 新的请求到来:所有的Work进程的listenfd都会变得可读

    • 竟抢互斥锁:所有 Worker 进程在注册listenfd读事件前,要先抢accept_mutex

    • 抢到互斥锁的Worker,注册listenfd读事件,在事件中调用accept接受该连接

    • 拿到请求后,Worker进程开始读取请求,解析请求,处理请求,产生数据,再返回给客户端

    • Worker进程断开连接

    需要注意:一个HTTP请求,完全由Worker进程处理,而且只在一个Worker中处理

    2.3 Master-Worker 进程架构机制的优势有哪些??

    对于每个Worker 进程来说,独立的进程,不需要加锁,节约锁导致的资源开销;worker进程之间,互不干扰,平滑重启就是很好的例子,服务不中断。

    2.4 网络事件处理机制

    Nginx 采用的是异步非阻塞事件处理机制,支持select/poll/epoll/kqueue 等等。Nginx 同时会监控多个事件,调用他们是阻塞的。但是调用有超时时间,在超时时间内,如果有事件准备好了,就返回,否则重新放入epoll中。当读写返回EAGAIN时,事件将会被再次放入epoll中。

    处理线程只有一个,同时处理的请求也只有一个,所谓多请求并发,只是在不断的切换请求而已。虽然是切换,但这种切换不涉及上下文切换,相比十分轻量。更多的并发,只是会占用更多的内存。

    进程相关的还有,信号和定时器,这部分另外单独讲解。

    3. Nginx 包含哪些模块

    Nginx是模块化架构的服务,丰富的模块,松散耦合,也让Nginx更加强大!我看看Nginx 都有哪些模块

    • 内核模块
      实现了底层的通讯协议,为其他模块/进程构建运行环境、协作基础,打开listen 的端口,启动worker进程

    • HTTP/Mail模块
      两个特殊模块,位于内核模块和各功能模块间;在内核模块之上实现了另一层的抽象;处理HTTP/MAIL协议事件;确保调用功能模块顺序正确。

    • Event模块
      负责监听accept后建立的连接,对读写事件进行添加删除;与非阻塞 I/O 模型结合使用;支持select/poll/epoll/kqueue等;注意惊群效应,后面有解释。

    • Handler模块
      负责接受客户端请求并产生输出;通过配置文件中location指令配置 content handler 模块。

    • Filter模块
      负责输出内容处理,修改输出内容;Fiter模块在获取回复内容之后,向用户发送响应之前,执行处理动作;调用顺序在编译时就确定了。

    • Upstream模块
      实现反向代理的功能,负责将请求转发到后端服务器上,并读取响应,发回客户端;跨越单机的限制,完成网络数据的接收、处理和转发;

    • LoadBalancer模块
      根据配置指定算法,在众多的后端服务器中选择一个,完成请求的转发服务器;都有哪些算法呢?

    惊群效应:

      • 当内核 accept 一个连接时,会唤醒所有等待中的进程

      • 但实际上只有一个进程能获取连接,其他的进程都是被无效唤醒的

      • 所以 Nginx 采用了自有的一套 accept 加锁机制,避免多个进程同时调用 accept

      • Nginx 多进程的锁在底层默认是通过 CPU 自旋锁来实现。如果操作系统不支持自旋锁,就采用文件锁。

    多路复用-select、epoll

    select

    I/O多路复用采用的是select 模型,即系统发出select系统调用,等待内核主动将可
    用的文件描述符信息发送给应用一端,fd未准备好,应用会block住socket请
    求,当fd就许后,select 会遍历维护的文件描述符发现可用的文件描述符。
    

    epoll

    每当fd就绪,系统采用回调函数将fd放入就绪列表,效率非常高。
    
    举例:
    告诉服务员,用餐结束,服务员告知老板,说有几桌要结账,老板需要询问
    告诉服务员,用餐结束,服务员告知老板,说哪号桌要结账,老板不需要询问。
    

    select epoll 优缺点总结

    模型优点缺点
    select   1.采用线性遍历的方式获取可用的fd文件描述符
    2.可维护文件描述符大小有限制为1024
    epoll 1.每当fd就绪,系统采用回调函数将fd放入就绪列表,效率非常高。
    2.最大连接数没有限制


  • 相关阅读:
    Postfix邮件服务
    Python
    LVS
    MFS
    Apache
    Zookeeper集群 + Kafka集群 + KafkaOffsetMonitor 监控
    shell 检测安装包
    shell ssh 批量执行
    shell 判断脚本参数
    bzoj 1500 修改区间 splay
  • 原文地址:https://www.cnblogs.com/xingxia/p/nginx_work_principle.html
Copyright © 2020-2023  润新知