Nginx请求流程
Nginx进程结构
Nginx有两种进程结构,一种是单进程(可以用于测试),一种是多进程(用于生产,默认)
Nginx会按需同时运行多个进程:一个主进程(master)和几个工作进程(worker),配置了缓存时还会有缓存加载器进程(cache loader)和缓存管理器进程(cache manager)等。Nginx主要通过“共享内存”的机制实现进程间通信。worker 进程数,一般会设置成机器 cpu 核数。因为更多的worker 数,只会导致进程相互竞争 cpu,从而带来不必要的上下文切换。
请求的缓存处理还是由work进程来执行的。CM:缓存的管理,CL:缓存的载入。
进程结构测试
1、ps -ef | grep nginx:可以查看到所有的work进程和cache进程 2、../sbin/nginx -s reload:重新加载配置 3、ps -ef | grep nginx:可以查看到之前所有的work进程和cache进程全部退出,重新生成新的work进程和cache进程 4、kill -SIGHUP 9170:向master进程发送hub信号,结果和reload一样 5、ps -ef | grep nginx:可以查看到之前所有的work进程和cache进程全部退出,重新生成新的work进程和cache进程 6、kill -SIGTERM 16982:向work进程发送退出信号 7、ps -ef | grep nginx:16982进程退出,会重新生成一个work进程
Nginx采用多进程而不是多线程,目的?
Nginx 的进程就是线程,即每个进程里只有一个线程,但这一个线程可以服务多个客户端。
Nginx需要保证高可用和高可靠性,多线程线程之间共享某一快地址空间,如果某一个第三方某块引发了一个地址空间导致的断错误时,在地址越界出现时,会导致整个Nginx整个进程挂掉。
nginx采用多进程的方式,既可以避免因某个线程故障导致整个服务不可用的问题,也可以实现配置热加载,不停服升级版本。
Nginx实现高并发原理?
参考:https://blog.csdn.net/m0_38110132/article/details/75126316
多进程之间通讯
多进程通讯可以使用共享内存,信号等,Nginx做进程管理通常只使用信号
Master进程可以监控wrok进程是否像master发送CHLD信号,因为子进程终止的时候回向父进程发送CHLD信号,如果work由于意外发生终止(认为输入命令终止,但是我们一般不这么做,我们通过发送命令给master,让master来终止work进程),此时master进程就会知道。
reload详解
1、向master进程发送HUP信号(reload命令) 2、master进程校验配置语法是否正确 3、master进程打开新的监听端口(配置文件可能添加了新的端口) 4、master进程用新配置启动新的worker子进程 5、master进程向老worker子进程发送QUIT信号 6、老worker进程关闭监听句柄,处理完当前连接后结束进程
热升级流程详解
1、将旧Nginx文件换成新Nginx文件(注意备份) 2、向master进程发送USR2信号 3、master进程修改pid文件名,加后缀.oldbin 4、master进程用新Nginx文件启动新master进程 5、向老master进程发送QUIT信号,关闭老master进程 6、回滚:向老master发送HUP,向新master发送QUIT
如果优雅的关闭work进程(缓慢的关闭)
如果当前的work已经在处理请求,立刻关闭连接,就会造成用户接受错误消息
1、设置定时器:worker shutdown timeout 2、关闭监听句柄 3、关闭空闲连接 4、在循环中等待全部连接关闭 5、退出进程
Nginx异步框架工作流程
Nginx事件循环
epoll使用优势
在大并发情况下,100万个请求,往往活跃连接数就几百个,所以epoll只需要处理这几百个连接,而select和poll需要将这100万个连接统统扔给操作系统,操作系统依次判断哪些连接有事件进来,所以操作系统做了大量的无用功
非堵塞调用
Nginx如果通过连接池来处理网络请求
欲分配的连接数目
参考:http://nginx.org/en/docs/ngx_core_module.html#worker_connections
Syntax: worker_connections number; Default: worker_connections 512; //512:512个数组,对应512个连接,生产中需要配置更大的 Context: events
一个客户端请求,需要使用一个connect连接(struct ngx_connection_s结构体占空间232个字节),一个连接对应两个事件读和写(struct ngx_event_s结构体占空间96个字节),所以worker_connections分配越大,初始化就会占用232+96*2个字节
补充:读和写超时时间配置:http://nginx.org/en/docs/http/ngx_http_core_module.html#client_header_timeout
一个请求到来,work占用连接数是2个或者4个,如果请求访问的是静态资源,nginx可以直接给用户返回,此时占用两个,如果请求的是动态资源,nginx需要将请求转发给tomcat,此时占用连接数是4个。
nginx有一个master,如果有4个work,每一个work支持的最大连接数是1024,支持的最大的并发数是多少?
(1) 4*1024/2
(2) 4*1024/4
nginx内存池
内存池是在真正使用内存之前,预先申请分配一定数量的、大小相等(一般情况下)的内存块留作备用。当有新的内存需求时,就从内存池中分出一部分内存块,若内存块不够用时,再继续申请新的内存。
内存池的好处有减少向系统申请和释放内存的时间开销,解决内存频繁分配产生的碎片,提示程序性能,减少程序员在编写代码中对内存的关注等
目前一些常见的内存池实现方案有STL中的内存分配区,boost中的object_pool,nginx中的ngx_pool_t,google的开源项目TCMalloc等。
在分配的内存上,nginx有小块内存和大块内存的概念,小块内存 nginx在分配的时候会尝试在当前的内存池节点中分配,而大块内存会调用系统函数malloc向操作系统申请
在释放内存的时候,nginx没有专门提供针对释放小块内存的函数,小块内存会在ngx_destory_pool 和 ngx_reset_pool的时候一并释放
分配时怎么判断是小块内存还是大块内存呢?
p->max=(size < NGX_MAX_ALLOC_FROM_POOL) ? size : NGX_MAX_ALLOC_FROM_POOL;
#define NGX_MAX_ALLOC_FROM_POOL (ngx_pagesize - 1)
Pagesize为内存一页的大小,x86结构通常为4k
Max为内存池可分配大小和pagesize中较小的一个
如果需要分配的内存大于max,则认为是较大内存,否则为较小内存
Nginx分配内存的配置
连接内存池的大小:http://nginx.org/en/docs/http/ngx_http_core_module.html#connection_pool_size(默认512|516,需要保存大量的上下文,比如很长的url,header)
请求内存池的大小:http://nginx.org/en/docs/http/ngx_http_core_module.html#request_pool_size(默认4k,因为保存的上下文比较少,只需要帮组后面的请求读取最初的一部分字节就可以了)
参考:https://www.cnblogs.com/magicsoar/p/6040238.html
Work进程之间协同工作
work之间如果需要共享数据,需要使用共享内存
信号量:会导致进程发生休眠状态,比如当某一个块内存被1号进程使用,那么2号就会进行休眠,等待1号通知2号锁已经释放
自旋锁:比如当某一个块内存被1号进程使用,那么2号就会不断的试图去解锁,要求所有的Nginx模块需要快速的使用共享内存
Slab内存管理
下载Tengine:http://tengine.taobao.org/download_cn.html (slab没有独立的模块,我们需要将tengin整个下载下来)
使用(编译nginx)
make之后对nginx进行热部署...
Nginx容器
数组
链表
队列
哈希表
红黑树
基数树