• nginx学习之web服务器(四)


    1. 定义一个虚拟服务器

    http {
        server {
            # Server configuration
        }
    }

    可以在http {}块里面添加多个server {}块,每一个server {}块代表一个虚拟服务器。

    2. 配置虚拟服务器监听的地址

    server {
        listen 127.0.0.1:8080;
        # The rest of server configuration
    }

    这个服务器专门处理从8080端口过来的请求。

    如果listen后面没有写端口,而只写了127.0.0.1,那么就监听默认端口80;

    如果listen后面没有写地址,而只写了8080,那么就监听所有网卡上的8080端口;

    如果没有配置listen指令,那么启动nginx后,它监听的地址就是0.0.0.0:80,表示监听所有网卡的80端口。"80/tcp"这是标准的端口。

    3. 配置虚拟服务器的server_name

    如果有多个虚拟主机匹配请求中的IP地址和端口,那么nginx会去检查请求头字段Host的值,然后匹配虚拟主机的server_name信息,最后决定使用哪个虚拟主机。

    server {
        listen      80;
        server_name example.org www.example.org;
        ...
    }

    server_name指令的参数可以是全名,通配符和正则表达式

    通配符:以*号开头的字符串,或以*号结尾的字符串,或开头和结尾都有*号的字符串。

    如果多个虚拟主机中的server_name都能匹配Host头,那么按照如下顺序来匹配:

    1 Exact name
    2 Longest wildcard starting with an asterisk, such as *.example.org
    3 Longest wildcard ending with an asterisk, such as mail.*
    4 First matching regular expression (in order of appearance in the configuration file)

    假如Host的信息是www.nicpotato.com,那么会在所有虚拟主机的server_name指令中首先寻找:www.nicpotato.com,然后寻找类似*.nicpotato.com这样的通配符,

    再然后寻找类似www.nicpotato.*这样的通配符,最后寻找类似[a-z]{3}.[a-zA-Z]{9}.[a-z]{3}这样的正则表达式。

    最先在哪个虚拟主机上匹配上,就使用哪个。

    如果Host的值不匹配所有的server_name,那么就选择一台默认的虚拟主机来处理:

    一般情况下,写在配置文件最前面的虚拟主机就是默认虚拟主机;但如果显式地在某个虚拟主机的listen指令后加了default_server参数,那么这台虚拟主机就是最后服务的主机。

    server {
        listen      80 default_server;
        ...
    }

    4. 配置location

    nginx是根据请求的URI来判断:是将请求转发到后端的proxy,还是由自己来提供文件。

    定义三个location块:

    1. send some requests to one proxied server
    2. send other requests to a different proxied server
    3. serve the rest of the requests by delivering files from the local file system.

    在极少数的情况下,可以在location的里面再嵌套location。

    location指令有2种类型的参数,第一种是路径名形式的前缀字符串第二种是正则表达式

    location /some/path/ {
        ...
    }

    对于上面这种路径名形式的前缀字符串(/some/path/),它能匹配任何以/some/path/开头的URI,比如/some/path/document.html,但是无法匹配

    /my-site/some/path/document.html,因为/some/path/没有出现在这个URI的前面。

    如果是正则表达式的话,必须在前面加上波浪线(~):表示区分大小写;或者加上波浪线星号(~*):表示不区分大小写

    location ~ .html? {
        ...
    }

    这个配置中,表示它可以匹配任何包含有(.html)和(.htm)字符串的URI。

    那么如何寻找一个最匹配URI的location呢?按照两条线:首先是路径名,然后是正则表达式。但正则表达式的优先级要比路径名高,什么意思?

    有一个URI是:/data/www/aa.png,我有2个location:

    location /data/www {
        ....  
    }
    
    location ~ .(png)$ {
        ...
    }

    你说应该用哪个location?初看起来,应该用/data/www这个,但实际上要用.(png)$这个location。因为正则的优先级高

    虽然/data/www作为前缀也能匹配,但我们没有提前下定论,而是先将它存储起来,然后继续往后匹配。看有没有更好的,再来决定使用它否。

    以下是选择最佳location的逻辑顺序:

    1. 首先让URI与所有的前缀字符串做匹配。--这是第一步
    
    2. 然后是找(=)修饰符,如果匹配了,就立刻停止,不再往后匹配。

    3.
    如果最长匹配的前缀字符串前面放置了一个(^~),那么就不再检查正则。也就是说如果前缀表达式匹配了,但后面还有正则表达式没有匹配,由于我的前缀表达式前面加了(^~),所以就
    不用匹配后面的正则了。
    4. 保存那个最长匹配的前缀字符串。 

    5. 让URI与正则表达式进行匹配。

    6. 使用第一个匹配的正则表达式。

    7. 如果没有正则匹配,就使用先前存储的那个前缀字符串对应的location。
    location = / {
        ...
    }

    这里,location指令的值是:(= /),表示精准匹配URI(/),对于一般的网站,访问(/)的频率很高,所以使用=,这样可以立即停止后面的匹配。

    server {
        location /images/ {
            root /data;
        }
    
        location / {
            proxy_pass http://www.example.com;
        }
    }

    5. 使用变量

    系统自带:

    $remote_addr

    $uri

    自定义:

    使用set,map,geo指令定义。

    6. 返回指定的状态码

    location /wrong/url {
        return 404;
    }
    location /permanently/moved/url {
        return 301 http://www.example.com/moved/here;
    }

    7. 重写请求里的URI

    location /users/ {
        rewrite ^/users/(.*)$ /show?user=$1 break;
    }

    rewrite指令的第一个参数是一个正则,用于匹配那些需要重写的URI第二个参数用于替换匹配到的URI第三个参数是一个标记,表示后面是否还进行重写,或者重定向

    用()括起来的部分代表一个变量,上面的例子中,只有一个(.*),所以括号里的内容代表$1,如果有多个(),就有$2,$3,$4...

    我在server里可以使用一次rewrite,然后继续在location使用rewrite,这个指令是否持续执行,取决于rewrite指令的第三个标记。

    server {
        rewrite ^/user/(.*)$ /show?user=$1 break;
    
        location /show {
            rewrite ^/show?(.*)$ /show/add?$1 break;
        }
    
        location /show/add {
            rewrite ^/show/add?(.*)$ /show/add/new?$1 break;
        }
    
        location /show/add/new {
            ...
        }
    
        location ~ .(png)$ {
            ...
        }
    }

    上面的例子中,只是为了说明,rewrite指令可以在多个地方使用,上面重写的结果会继续在后面匹配,除非在rewrite指令的后面加上stop的标记。

    重写的最后结果还是需要在多个location之间进行匹配。

    下面的截图结合了rewrite指令和return指令:

    server {
        ...
        rewrite ^(/download/.*)/media/(.*)..*$ $1/mp3/$2.mp3 last;
        rewrite ^(/download/.*)/audio/(.*)..*$ $1/mp3/$2.ra  last;
        return  403;
        ...
    }

    一个URI进来,先看第一条重写规则,如果能匹配,就进行重写;如果不能匹配就看第二条规则,如果这两条都不能匹配,就返回403错误。

    last指令用于表示:执行完重写指令后,后面的指令都忽略,也就是不再执行。

    但是收费版nginx却会继续执行后面的指令,且会将重写后的URI作为新的URI来处理

    有2个标记可以打断rewrite指令:

    break:就跟程序中的break一样,表示:停止处理当前上下文中rewrite指令,并且取消对于新URI的匹配。

    last:停止执行当前server块或location块中的rewrite指令。收费版的nginx可以对新URI进行匹配,进而可以执行后面location中的rewrite指令。(表示URI还可以再改变)

    8. 重写HTTP响应

    可以使用sub_filter指令可以替换响应中的内容。比如修改某个字符串为另一个。

    这个命令支持变量、链式替换,可以使修改更加复杂。

    可以修改为指向某个服务器的绝对链接,而不是指向某个proxy:

    location / {
        sub_filter      /blog/ /blog-staging/;
        sub_filter_once off;
    }

    修改相应中的协议和主机地址:

    location / {
        sub_filter     'href="http://127.0.0.1:8080/'    'href="https://$host/';
        sub_filter     'img src="http://127.0.0.1:8080/' 'img src="https://$host/';
        sub_filter_once on;
    }

    某个请求是由location /处理的,返回的请求中原先是http://127.0.0.1:8080,替换后变为:https://$host/,这样客户端就去找这个真实的地址https://$host/。

    sub_filter_once指令用于表示:sub_filter指令执行的次数。off表示连续执行,on表示只执行一次。

    注意:响应中已经被sub_filter指令修改的部分,不再匹配后面的sub_filter指令

    9. 处理错误

    给某个状态码配置一个特定的错误页面返回给用户:

    error_page 404 /404.html;

    如果服务器返回给客户端的状态码为404,就会返回这个404.html页面给用户。这些错误页面可以自定义。

    注意:error_page指令不能让404错误立即返回,只有return指令才有这个功能。它只是定义了当错误发生时的处理方式。

    错误码可能来自后端服务器,或者是因为服务器找不到用户请求的文件。

    location /old/path.html {
        error_page 404 =301 http:/example.com/new/path.html;
    }

    当用户访问旧路径时,肯定是会返回一个带404错误的响应,但是nginx的处理方式是用301状态码替代404状态码,然后再返回一个新地址,告诉用户去访问这个新地址。

    由于用户保存了旧有的访问方式,为了不返回错误,就用这种方式柔性处理,达到很好的用户体验效果。

    server {
        ...
        location /images/ {
            # Set the root directory to search for the file
            root /data/www;
    
            # Disable logging of errors related to file existence     
            open_file_cache_errors off;     // 这里的设置表示如果文件没有找到,不记录这条日志信息,因为后面的location正确处理了,所以没有必要记录
    
            # Make an internal redirect if the file is not found
            error_page 404 = /fetch$uri;
        }
    
        location /fetch/ {
            proxy_pass http://backend/;
        }
    }

    当我们请求/images/aa.png时,它首先到/data/www/images/下去寻找aa.png,如果找不到,按照正常流程,肯定是要返回404错误的,但是这个location里还有一个

    error_page指令,告诉nginx如何去处理404错误。

    这个例子中,等号后面为空,表示nginx不知道用什么状态码来替换404,所以先保留这一块。然后做一个内部重定向,此时nginx再次去请求/fetch/images/aa.png,这个新的

    URI能够匹配下面的location,也就是去请求后台服务器,后台服务器处理后,会返回一个响应,然后返回给用户。(响应中的状态码会替换前面的错误码404)。

    注意:本节的重点在于location的匹配顺序以及rewrite指令,同时对于每个功能需要测试,以加深理解。同时这些东西得经常查看,否则很容易遗忘。

  • 相关阅读:
    java编码规范
    Unix操作系统内核结构报告
    vim常用命令组合
    JavaWeb学习笔记13--Servlet开发(二)
    JavaWeb学习笔记12--Servlet开发(一)
    JavaWeb学习笔记11--JSTL标签库
    JavaWeb学习笔记10--Cookie实现记住密码的功能
    JavaWeb学习笔记9--JSP属性范围
    JavaWeb学习笔记8--JSP内置对象详解
    JavaWeb学习笔记7--JSP脚本元素、指令元素、动作元素
  • 原文地址:https://www.cnblogs.com/t-road/p/6735082.html
Copyright © 2020-2023  润新知