1. Nginx简介
1.1 Nginx 的应用场景
Nginx ("engine x")
是一个 高性能的 HTTP 和反向代理服务器,特点是占有内存少,并发能力强。事实上 Nginx 的并发能力确实在同类型的网页服务器中表现较好,中国大陆使用 Nginx 的网站用户有:百度、京东、新浪、网易、腾讯、淘宝等。
Nginx 可以作为静态页面的 web 服务器,同时还支持 CGI 协议的动态语言比如 perl、php等,但是不支持 java,Java 程序只能通过与 tomcat 配合完成。Nginx 专为性能优化而开发,性能是其最重要的考量,实现上非常注重效率 ,能经受高负载的考验,有报告表明能支持高达 50,000 个并发连接数。
Nginx 是 C语言开发,建议在 Linux 上运行,当然也可以安装 Windows 版本。
1.2 反向代理与反向代理
正向代理
Nginx 不仅可以做反向代理实现负载均衡,还能用作为正向代理来进行上网等功能。正向代理:如果把局域网外的 Internet 想象成一个巨大的资源库,则局域网中的客户端要访问 Internet则需要通过代理服务器来访问,这种代理服务就称为正向代理。
反向代理
其实客户端对代理是无感知的,因为客户端不需要任何配置就可以访问网页,我们只需要将请求发送到反向代理服务器,由反向代理服务器去选择目标服务器获取数据后再返回给客户端,此时反向代理服务器和目标服务器对外就是一个服务器,暴露的是代理服务器地址,隐藏了真实服务器 IP 地址。
1.3 负载均衡
客户端发送多个请求到服务器,服务器处理请求,有一些可能要与数据库进行交互,服务器处理完毕后再将结果返回给客户端。 这种架构模式对于早期的系统相对单一,并发请求相对较少的情况下是比较适合的成本也低。但是随着信息数量的不断增长,访问量和数据量的飞速增长,以及系统业务的复杂度增加,这种架构会造成服务器相应客户端的请求日益缓慢,并发量特别大的时候还容易造成服务器直接崩溃。很明显这是由于服务器性能的瓶颈造成的问题,那么如何解决这种情况呢?
我们首先想到的可能是升级服务器的配置,比如提高 CPU 执行频率,加大内存等提高机器的物理性能来解决此问题,但是我们知道摩尔定律的日益失效,硬件的性能提升已经不能满足日益提升的需求了。最明显的一个例子,天猫双十一当天某个热销商品的瞬时访问量是极其庞大的,那么类似上面的系统架构,将机器都增加到现有的顶级物理配置,都是不能够满足需求的。那么怎么办呢?
上面的分析我们去掉了增加服务器物理配置来解决问题的办法也就是说纵向解决问题的办法行不通了,那么横向增加服务器的数量呢?这时候集群的概念产生了,单个服务器解决不了我们增加服务器的数量,然后将请求分发到各个服务器上,将原先请求集中到单个服务器上的情况改为将请求分发到多个服务器上,将负载分发到不同的服务器,也就是我们所说的负载均衡
1.4 动静分离
为了加快网站的解析速度,可以把动态页面和静态页面由不同的服务器来解析加快解析速度。降低原来单个服务器的压力。
2. 安装
2.1 在Linux中安装Nginx
GCC安装(如果没有的话)
安装 nginx 需要先将官网下载的源码进行编译,编译依赖 gcc 环境,如果没有 gcc 环境则需要安装
pcre安装
PCRE(Perl Compatible Regular Expressions) 是一个Perl库,包括 perl 兼容的正则表达式库。nginx 的 http 模块使用 pcre 来解析正则表达式,所以需要在 linux 上安装 pcre 库,pcre-devel 是使用 pcre 开发的一个二次开发库。nginx也需要此库。
openssl安装
OpenSSL 是一个强大的安全套接字层密码库,囊括主要的密码算法、常用的密钥和证书封装管理功能及 SSL 协议,并提供丰富的应用程序供测试或其它目的使用。nginx 不仅支持 http 协议,还支持 https(即在ssl协议上传输http),所以需要在 Centos 安装 OpenSSL 库。
zlib安装
zlib库提供了很多种压缩和解压缩方式,nginx使用zlib对http包的内容进行gzip,所以需要安装
nginx安装,启动、停止
防火墙相关
2.2 使用docker-compose 安装Nginx
下面以本人搭建的博客系统为例,看不懂的先看后面章节
创建docker-compose.yml
创建配置文件nginx.conf
3. 配置文件
3.1 nginx.conf
nginx 安装目录下其默认的配置文件都放在这个目录的 conf 目录下,而主配置文件nginx.conf 也在其中,对 nginx 的使用基本上都是对此配置文件进行相应的修改。
根据nginx.conf配置文件,可将其分为三部分
3.2 第一部分:全局块
从配置文件开始到 events 块之间的内容,主要会设置一些影响 nginx 服务器整体运行的配置指令,主要包括配置运行 Nginx 服务器的用户(组),允许生成的 worker process 数,进程 PID 存放路径、日志存放路径和类型以及配置文件的引入等。
如下配置,这是 Nginx 服务器并发处理服务的关键配置,worker_processes 值越大,可以支持的并发处理量也越多,但是会受到硬件、软件等设备的制约。
3.3 第二部分:events块
events 块涉及的指令主要影响 Nginx 服务器与用户的网络连接,常用的设置包括是否开启对多 work process 下的网络连接进行序列化,是否允许同时接收多个网络连接,选取哪种事件驱动模型来处理连接请求,每个 word process 可以同时支持的最大连接数等。
这部分的配置对 Nginx 的性能影响较大,在实际中应该灵活配置。
如下例子就表示每个 work process 支持的最大连接数为 1024。
3.4 第三部分:http块
http块算是 Nginx 服务器配置中最频繁的部分,代理、缓存和日志定义等绝大多数功能和第三方模块的配置都在这里。 需要注意的是:http 块也可以包括 http 全局块、server 块。
http全局块
http 全局块配置的指令包括文件引入、MIME-TYPE 定义、日志自定义、连接超时时间、单链接请求数上限等。
server块
这块和虚拟主机有密切关系,虚拟主机从用户角度看,和一台独立的硬件主机是完全一样的,该技术的产生是为了节省互联网服务器硬件成本。
每个 http 块可以包括多个 server 块,而每个 server 块就相当于一个虚拟主机。而每个 server 块也分为全局 server 块,以及可以同时包含多个 locaton 块。
全局 server 块
:常见的配置是本虚拟机主机的监听配置和本虚拟主机的名称或 IP 配置。location 块
:一个 server 块可以配置多个 location 块。这块的主要作用是基于 Nginx 服务器接收到的请求字符串(例如 server_name/uri-string),对虚拟主机名称(也可以是 IP 别名)之外的字符串(例如 前面的 /uri-string)进行匹配,对特定的请求进行处理。地址定向、数据缓存和应答控制等功能,还有许多第三方模块的配置也在这里进行。
4. 配置实例 - 反向代理
4.1 实例一
实现效果
在浏览器地址栏输入地址www.123.com,就会跳转到Linux系统tomcat主页面中
准备内容
在Linux系统中安装tomcat并启动
nginx.conf配置
4.2 实例二
实现效果
使用nginx反向代理,根据访问的路径跳转到不同端口的服务中。
- nginx监听端口为9001
- 访问http://192.168.204.130:9001/edu/,直接跳转到127.0.0.1:8081
- 访问http://192.168.204.130:9001/vod/,直接跳转到127.0.0.1:8082
准备内容
- 准备两个tomcat,一个8081端口,一个8082端口,并在两个tomcat中分别准备好测试的页面
- 修改nginx的配置文件,在http块中编写server{}逻辑
nginx.conf配置
5. 配置实例 - 负载均衡
5.1 实例
实现效果
浏览器地址栏输入地址http://192.168.204.130/Test/test.html,实现负载均衡效果,即将平均到8080和8081端口中
准备工作
- 两台tomcat服务器,一个为8080端口另一个为8081端口
- 在两台tomcat的webapps目录中,创建Test文件夹并在其中创建test.html页面用于测试
nginx.conf配置
5.2 nginx分配服务器策略
第一种:轮询(默认)
每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉能自动剔除
第二种:weight
weight 代表权重默认为 1,权重越高被分配的客户端越多
第三种:ip_hash
每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器。可以解决session共享的问题
第四种:fair(第三方)
按后端服务器的响应时间来分配请求,响应时间短的优先分配
6. 配置实例 - 动静分离
6.1 理解
Nginx 动静分离简单来说就是把动态跟静态请求分开,不能理解成只是单纯的把动态页面和静态页面物理分离。严格意义上说应该是动态请求跟静态请求分开,可以理解成使用 Nginx 处理静态页面,Tomcat 处理动态页面。
动静分离从目前实现角度来讲大致分为两种,一种是纯粹把静态文件独立成单独的域名放在独立的服务器上,也是目前主流推崇的方案;另外一种方法就是动态跟静态文件混合在一起发布,通过 nginx 来分开。通过 location 指定不同的后缀名实现不同的请求转发。
通过 expires 参数可以设置浏览器缓存过期时间,减少与服务器之前的请求和流量。具体 Expires 定义:是给一个资源设定一个过期时间,也就是说无需去服务端验证,直接通过浏览器自身确认是否过期即可,不会产生额外的流量。此种方法非常适合不经常变动的资源。(如果经常更新的文件,不建议使用 Expires 来缓存),我这里设置 3d,表示在这 3 天之内访问这个 URL,发送一个请求,比对服务器该文件最后更新时间没有变化,则不会从服务器抓取返回状态码304,如果有修改则直接从服务器重新下载,返回状态码 200。
6.2 实例
项目资源准备
nginx 配置
重点是添加 location,最后检查 Nginx 配置是否正确即可,然后测试动静分离是否成功,之需要删除后端 tomcat 服务器上的某个静态文件,查看是否能访问,如果可以访问说明静态资源 nginx 直接返回了,不走后端 tomcat 服务器。
7. 搭建Nginx高可用集群
7.1 主从模式
图示
搭建环境
- 两台服务器192.168.0.1与192.168.0.2
- 在两台服务器上安装Nginx,keepalived
- keepalived安装成功后在/etc下生成一个文件keepalived/keepalived.conf,对其进行配置
- 编写检测脚本文件 nginx_check.sh
- 将两台服务器上的nginx和keepalived都启动起来
- 访问虚拟ip,查看是否能访问到nginx主页
- 停掉主Nginx服务器后,访问虚拟ip,查看是否能访问到nginx主页
7.2 双主模式
图示
搭建环境
其他步骤与主从模式类似,只是keepalived.conf配置文件有所变化
8. Nginx原理与优化参数配置
8.1 master & worker
master & worker机制
master-workers 的机制的好处
首先对于每个 worker 进程来说独立的进程不需要加锁,省掉了锁带来的开销,同时在编程以及问题查找时也会方便很多。
其次采用独立的进程可以让互相之间不会影响,一个进程退出后其它进程还在工作,服务不会中断,master 进程则很快启动新的worker 进程,同时还支持 热部署(nginx -s reload)。当然worker 进程的异常退出肯定是程序有 bug 了,异常退出会导致当前 worker 上的所有请求失败,不过不会影响到所有请求降低了风险。
worker如何工作
需要设置多少个worker
Nginx 同 Redis 类似都采用了 IO 多路复用机制(注意windows系统没有该功能),每个 worker 都是一个独立的进程,但每个进程里只有一个主线程,通过异步非阻塞的方式来处理请求, 即使是千上万个请求也不在话下。每个 worker 的线程可以把一个 cpu 的性能发挥到极致。所以 worker 数和服务器的 cpu数相等 是最为适宜的。设少了会浪费 cpu,设多了会造成 cpu 频繁切换上下文带来的损耗。
设置worker数量
连接数 worker_connection
这个值是表示每个 worker 进程所能建立连接的最大值,所以一个 nginx 能建立的最大连接数,应该是 worker_connections * worker_processes
。当然这里说的是最大连接数,对于HTTP 请 求 本 地 资 源
来 说 能 够 支 持 的 最 大 并 发 数 量
是 worker_connections * worker_processes
,如果是支持 http1.1 的浏览器每次访问要占两个连接,所以普通的静态访问最大并发数
是: worker_connections * 、worker_processes /2
,而如果是 HTTP 作为反向代理来
说,最大并发数量
应该是 worker_connections * worker_processes/4
。因为作为反向代理服务器,每个并发建立与客户端的连接和与后端服务的连接会占用两个连接。