• Nginx中间件使用心得(二)


    一、基础知识补充

          1、 历史由来补充:

    Nginx是俄罗斯第二大网站的开源项目。
    淘宝团队发行了 tengine 增加了很多第三方的包。

          2、下载相关的主键

      (1)nginx下载地址
             http://nginx.org/en/download.html
        (2)pcre库下载地址,nginx需要(做正则表达式的解析的)
            http://sourceforge.net/projects/pcre/files/pcre/
        (3)zlib下载地址,nginx需要(用途用来做压缩的)
            http://www.zlib.net/
       (4)openssl下载地址,nginx需要(https加密需要的包)
            https://github.com/openssl/openssl
        3、nginx的模块基础构成

     1 main
     2        events{
     3          ....
     4        }
     5        http{
     6           ...
     7       upsream myproject{
     8         .....
     9       
    10       }
    11           server {
    12         ....
    13         location{
    14             ....
    15         }
    16       }
    17           server{
    18         ....
    19         location{
    20             ....
    21         }
    22       }
    23           ....
    24        }
    View Code

        4、nginx配置文件主要分为六个区域:

           (1)main(全局设置)
           (2)events(nginx工作模式)
           (3)http(http设置)
           (4)server(主机设置)
           (5)location(URL匹配)
           (6)upstream(负载均衡服务设置)

    二、六个分区的主要作用
         

    (1)main模块:
              a、下面是一个main区域,它是一个全局的设置:
            user nobody nobody;
            worker_processes 2;
            error_log  /user/local/var/log/nginx/error.log notice;
            pid        /user/local/var/log/nginx/nginx.pid;
            worker_rlimit_nofile 1024;
            
        字段解释:
                1、user来指定Nginx Worker进程运行用户以及用户组,默认由nobody账号运行
                2、worker_processes来指定了Nginx要开启的子进程数,每个Nginx进程平均耗费10M~12M内存.根据经验,一般指定1个进程就足够了,如果是多核CPU,建议指定和CPU的数量一样的进程数即可.
            这里写2,那么就会开启2个子进程,总共3个进程.
            3、error_log用来定义全局错误日志文件.日志输出级别有debug/info/notice/warn/error/crit可供选择,其中,debug输出日志最为详细,而crit输出日志最少.
            4、pid用来指定进程id的存储文件位置
            5、worker_rlimit_nofile用于指定一个nginx进程可以打开的最多文件描述符数目,这里是65535,需要使用命令"ulimit -n 65535"来设置.
    
          (2)events模块
             events模块来用指定nginx的工作模式和工作模式及连接数上限,一般是这样:
            events{
                use epoll; #linux平台
            worker_connections  1024;
            }
    
             1、use用来指定Nginx的工作模式。Nginx支持的工作模式有select、poll、kqueue、epoll、rtsig和/dev/poll.其中select和poll都是标准的工作模式,kqueue和epoll是高效的工作模式,不同的是epoll用在Linux平台上,而kqueue用在BSD系统中,对于Linux系统,epoll工作模式是首选.
         2、worker_connections用于定义Nginx每个进程的最大连接数,即接收前端的最大请求数,默认是1024.最大客户端连接数由worker_processes和worker_connecitons决定,即Max_clients=worker_processes*worker_connections/4.进程的最大连接数受Linux系统进程的最大打开文件数限制,在执行
         操作系统命令"ulimit -n 65536"后worker_connections的设置才能生效.
    
           (3)http模块
              1、http模块可以说是最核心的模块了,它负责HTTP服务器相关属性的配置,它里面的server和upstream子模块,至关重要,等到反向代理和负载均衡以及虚拟目录等会详细概述.
                  http{
                 include  mime.types;
             default_type application/octet-stream;
                     log_format  access  '$remote_addr - $remote_user [$time_local] "$request" '
                         '$status $body_bytes_sent "$http_referer" '
                         '"$http_user_agent" "$http_x_forwarded_for"'
                 'ups_resp_time: $upstream_response_time '                        
                           'request_time: $request_time';
    
             access_log  /usr/local/nginx/logs/access.log  access;
    
             sendfile        on;
                     tcp_nopush on; #防止网络阻塞
                     tcp_nodelay on; #防止网络阻塞
    
                     keepalive_timeout 120; #长连接超时时间,单位是秒
             gzip  on;
             upstream myproject {
                        .....  
                     }
    
             server {
                ....
             }
              }
              2、下面详细介绍下这段代码中每个配置选项的含义。
            include来用设定文件的mime类型,类型在配置文件目录下的mime.type文件定义,来告诉nginx识别文件类型.
            default设定了默认的类型为二进制流,也就是当文件类型未定义时使用这种方式,例如在没有配置asp的locate环境时,
            Nginx是不予解析的,此时,用浏览器访问asp文件就会出现下载了.
            log_format用于设置日志的格式,和记录哪些参数,这里设置为main,刚好用于access_log来记录这种类型.
            main的类型日志如下:也可以增删部分参数.
    
            access_log
              用来记录每次的访问日志的文件地址,后面的main是日志的格式样式,对应于log_format的main.
            
            sendfile参数用于开启高效文件传输模式.将tcp_nopush和tcp_nodelay两个指令设置为on用于防止网络阻塞.
    
            keepalive_timeout设置客户端连接保持活动的超时时间.在超过这个时间之后,服务器会关闭该连接.
    
         (4)server模块
            server模块是http的子模块,它用来定一个虚拟主机,本次描述最基本的配置,其余后续补充.
    
            一个简单的server是如何做的?
               server{
                   listen  8080;
               server_name  localhost 192.168.12.10 www.myprojectdd.com;
               #全局定义,如果都是这一个目录,这样定义最简单.
               root /user/myprojectdd/www;
               index index.html index.htm;
               charset utf-8;
               access_log usr/local/var/log/host.access.log main;
                       access_log usr/local/var/log/host.error.log error;
               ....
          }
         }
    
          1、server标志定义虚拟主机开始。
          2、listen用于定义虚拟主机的服务端口。
          3、server_name用来指定IP地址或者域名,多个域名之间用空格分开.
          4、root表示在这整个server虚拟主机内,全部的root web根目录,注意要和locate{}下面定义的区分开来。
          5、index全局定义访问的默认首页地址。注意要和locate{}下面定义的区分开来。
          6、charset用于设置网页的默认编码格式。
          7、access_log用来指定此虚拟主机的访问日志存放路径,最后的main用于指定访问日志的输出格式.
          
         (5)locaiton 模块
            1、location模块是nginx中用的最多的,也是最重要的模块了,什么负载均衡/反向代理/虚拟域名都与它相关.
        2、location根据它字面意思就知道是来定位的,定位URL,解析URL,所以,它也提供了强大的正则匹配功能,也支持条件判断匹配,用户可以通过location指令实现Nginx对动静态网页进行过滤处理.
        设定默认首页和虚拟目录.
            location / {
                   root /user/myprojectdd/www;
               index index.html index.htm; 
            }
    
        location/表示匹配访问根目录.
        
        root指令用于指定访问根目录时,虚拟主机的web目录,这个目录可以是相对路径(相对路径是相对于nginx的安装目录).也可以是绝对路径.
               
        #反向代理配置
        location /itcast/ {
                 proxy_pass http://127.0.0.1:12345;
             proxy_set_header X-real-ip $remote_addr;
             proxy_set_header Host #http_host;
        }
    
        #采用uwsgi方式
        location /python/ {
                include   uwsgi_params;
            uwsgi_pass  127.0.0.1:33333;
        }
           
           #访问nginx本机目录的文件
           location / {
                root /home/aaaa/xwp/aaa/;
                index index.html index.htm; 
           }
    
           location /static/ {
                alias /var/static/;
           }
    
        (6)upstream 模块
            upstream模块负载均衡模块,通过一个简单的调度算法来实现客户端IP到后端服务器的负载均衡,实例后期讲解.
          
          upstream test.com{
              ip_hash;
              server  192.168.123.1:80;
              server  192.168.123.2:80 down;
              server  192.168.123.3:8080 max_fails=3 fail_timeout=20s;
              server  192.168.123.4:8080;
          }
    
        在上面的例子中,通过upstream指令定了一个负载均衡器的名称test.com.这个名称可以任意指定,在后面需要的地方直接调用即可.
        里面是ip_hash这是其中的一种负载均衡调度算法.
    
           Nginx的负载均衡模块目前支持4种调度算法:
              (1)weight轮询(默认).每个请求按时间顺序逐一分配到不同的后端服务器,如果后端某台服务器宕机,故障系统被自动剔除,使用户访问不受影响.
          weight指定轮询权值,weight值越大,分配到的访问几率越高,主要用于后端每个服务器性能不均的情况下.
               (默认是均衡分配的,但是如果后台的配置服务器一个是4核,一个是8核,那么就是不均衡,就可以给8核的分配更高的被匹配到概率,weight=8,4核的weight=2)
    
          (2)ip_hash 每个请求按访问IP的hash结果分配,这样来自同一个IP的访问固定访问一个后端服务器,有效解决了动态网页存在的共享sessi共享问题
               (IP地址映射成哈希,然后哈希发送到服务器上再识别,可以保证客户端访问的是同一台业务服务器,应用在tomcat配置了redis缓存服务的时候,下一次访问直接返回数据,节省了访问数据库的时间,如果单个服务器配置缓存就采用ip哈希的算法连接,如果是单独一个服务器专门做缓存,那就设置成轮询,也就是看缓存是绑定每个服务器还是一个公共服务器)
    
          (3)fair比上面两个更加智能的负载均衡算法,此种算法可以依据页面大小和加载时间长短智能地进行负载均衡,也就是根据后端服务器的响应时间来分配请求,响应时间短的优先分配.
          Nginx本身不支持fair的,如果需要使用这种调度算法,必须下载Nginx的upstream_fair模块.
              (根据tomcat服务器反应速度分配任务,反应快的多分配任务,反应慢的少分配任务)
    
          (4)url_hash 按访问url的hash结果分配请求,使每个url定向到同一个后端服务器,可以进一步提高后端缓存服务器的效率.Nginx本身是不支持url_hash的,如果需要使用这种调度算法,必须安装Nginx的hash软件包.
          (根据访问地址截获访问后端数据库)
          
          在HTTP Upstream模块中,可以通过server指令指定后端服务器的IP地址和端口,同时还可以设定每个后端服务器在负载均衡调度中的状态,常用的状态有:
             (1)down 表示当前的server暂时不参与负载均衡
         (2)backup 预留的备份机器,当其他所有的非backup机器出现故障或者忙的时候,才会请求backup机器,因此这台机器的压力最轻.
         (3)max_fails 允许请求失败的次数,默认为1,当超过最大次数时,返回proxy_next_upstream模块定义的错误.
         (4)fail_timeout 在经历了max_fails次失败后,暂停服务的同时,max_fails可以在fail_timeout一起使用.
         注意:
              当负载均衡算法为ip_hash时,后端服务器在负载均衡调度的状态不能是weight和backup.
         备注:
              nginx的worker_rlimit_nofile达到上限时,再有客户端链接报502错误,用了log_format指令设置了日志格式之后,需要用access_log指令指定日志文件的存放路径.
  • 相关阅读:
    tar.xz文件如何解压
    warnings and errors when executing : make -j4
    ubuntu关机
    Linux系统kernel编译替换升级
    安装linux内核
    二叉树的度数和节点数的关系
    刷题--将搜索二叉树转换成双向链表
    刷题--二叉搜索树与双向链表
    刷题--删除链表中重复的节点
    四舍五入输出
  • 原文地址:https://www.cnblogs.com/liuyangfirst/p/8471658.html
Copyright © 2020-2023  润新知