• Nginx 模块开发(1)—— 一个稍稍能说明问题模块开发 Step By Step 过程


    1. Nginx 介绍
     
         Nginx是俄罗斯人编写的十分轻量级的HTTP服务器,它的发音为“engine X”, 是一个高性能的HTTP和反向代理服务器,同时也是一个IMAP/POP3/SMTP 代理服务器.Nginx是由俄罗斯人 Igor Sysoev为俄罗斯访问量第二的 Rambler.ru站点开发的,从2004年开始它已经在该站点运行了七八年了。Igor Sysoev在建立的项目时,使用基于BSD许可。
         英文主页:http://nginx.org.
     
         Nginx以事件驱动的方式编写,所以有非常好的性能,同时也是一个非常高效的反向代理、负载平衡。
         现在,Igor将源代码以类BSD许可证的形式发布。Nginx因为它的稳定性、丰富的模块库、灵活的配置和低系统资源的消耗而闻名.业界一致认为它是Apache+mod_proxy_balancer的轻量级代替者,不仅是因为响应静态页面的速度非常快,而且它的模块数量也非常非常丰富。对proxy 和 rewrite模块的支持很彻底,还支持mod_fcgi、ssl、vhosts ,适合用来做mongrel clusters的前端HTTP响应。

      nginx做为HTTP服务器,有以下几项基本特性:

    处理静态文件,索引文件以及自动索引;打开文件描述符缓冲.
    无缓存的反向代理加速,简单的负载均衡和容错.
    FastCGI,简单的负载均衡和容错.
    模块化的结构。包括gzipping, byte ranges, chunked responses,以及 SSI-filter等filter。如果由FastCGI或其它代理服务器处理单页中存在的多个SSI,则这项处理可以并行运行,而不需要相互等待。
    支持SSL 和 TLSSNI.

      Nginx专为性能优化而开发,性能是其最重要的考量,实现上非常注重效率。它支持内核 epoll、kqueue 等高性能并发模型,能经受高负载的考验。

      Nginx具有很高的稳定性。其它HTTP服务器,当遇到访问的峰值,或者有人恶意发起慢速连接时,也很可能会导致服务器物理内存耗尽频繁交换,失去响 应,只能重启服务器。例如当前apache一旦上到200个以上进程,web响应速度就明显非常缓慢了。而Nginx采取了分阶段资源分配技术,使得它的 CPU与内存占用率非常低。nginx官方表示保持10,000个没有活动的连接,它只占2.5M内存,所以类似DOS这样的攻击对nginx来说基本上 是毫无用处的。就稳定性而言,nginx比lighthttpd更胜一筹。

      Nginx支持热部署。它的启动特别容易, 并且几乎可以做到7*24不间断运行,即使运行数个月也不需要重新启动。你还能够在不间断服务的情况下,对软件版本进行进行升级。

      Nginx采用master-slave模型,能够充分利用SMP的优势,且能够减少工作进程在磁盘I/O的阻塞延迟。当采用select()/poll()调用时,还可以限制每个进程的连接数。

      Nginx代码质量非常高,代码很规范,手法成熟, 模块扩展也很容易。特别值得一提的是强大的Upstream与Filter链。 Upstream为诸如reverse proxy,与其他服务器通信模块的编写奠定了很好的基础。而Filter链最酷的部分就是各个filter不必等待前一个filter执行完毕。它可以 把前一个filter的输出做为当前filter的输入,这有点像Unix的管线。这意味着,一个模块可以开始压缩从后端服务器发送过来的请求,且可以在 模块接收完后端服务器的整个请求之前把压缩流转向客户端。

      当然,nginx还很年轻,多多少少存在一些问题,比如:Nginx是俄罗斯人创建,目前文档方面还不是很完善.因为文档大多是俄语,所以文档方面这也是个障碍.尽管nignx的模块比较多,但它们还不够完善。对脚本的支持力度不够。

      这些问题,nginx的作者和社区都在努力解决,我们有理由相信nginx将继续以高速的增长率来分享轻量级HTTP服务器市场,会有一个更美好的未来。
     
    2. 准备工作
          去官方主页 http://nginx.org/ 下载最新的Nginx源码包,这里给出目前最新的源码包的直接连接: http://nginx.org/download/nginx-1.0.0.tar.gz 

    [zieckey@freebsd7.2 ~]$ mkdir nginx
    [zieckey@freebsd7.2 ~]$ cd nginx
    [zieckey@freebsd7.2 ~/nginx]$ wget http://nginx.org/download/nginx-1.0.0.tar.gz
    [zieckey@freebsd7.2 ~/nginx]$ tar zxf nginx-1.0.0.tar.gz
    [zieckey@freebsd7.2 ~/nginx]$ mkdir module_dev_urlquery
    [zieckey@freebsd7.2 ~/nginx]$ cd module_dev_urlquery/
    [zieckey@freebsd7.2 module_dev_urlquery]$


    这里我们下载了 nginx-1.0.0 的源码,然后准备开发一个 module_dev_urlquery 的module嵌入到nginx中 

    3. 准备好 module_dev_urlquery 模块的配置文件 
    一个 nginx module 一般都以个文件夹的方式存在,module源文件和该module的配置文件都在这个文件下面。
    这里我们的module叫 module_dev_urlquery,其路径为 /home/zieckey/nginx/module_dev_urlquery 。
    其配置文件名为:config ,其路径为 /home/zieckey/nginx/module_dev_urlquery/config
    [zieckey@freebsd7.2 module_dev_urlquery]$ vim config
     
    然后输入以下内容:

    [zieckey@freebsd7.2 module_dev_urlquery]$ vim config
    ngx_addon_name=ngx_http_p2s_module
    HTTP_MODULES="$HTTP_MODULES ngx_http_p2s_module"
    NGX_ADDON_SRCS="$NGX_ADDON_SRCS $ngx_addon_dir/ngx_http_p2s_module.c"

    这里三行内容稍稍解释下:
    第一行是表示这个 nginx module 在程序中名字
    第二行表示这是一个HTTP module,后面的名字与第一个行保存一致
    第三是这个module的源文件路径,值得说明的是 $ngx_addon_dir 这个变量是 nginx 的内置脚本的内置变量,代表了这个 module 的文件夹的绝对路径,这里就是 /home/zieckey/nginx/module_dev_urlquery
     
    4. 准备源代码文件 ngx_http_p2s_module.c 
    这里的文件名和路径必须与上面 config 文件中的一致
    [zieckey@freebsd7.2 module_dev_urlquery]$ vim ngx_http_p2s_module.c
    输入以下源程序内容:


    #include <ngx_core.h>
    #include <ngx_http.h>
    #include <nginx.h>

    typedef struct {
        unsigned long consume;
        char* ini_buf;
        size_t buflen;//the lenght of the ini_buf

    } ngx_http_p2s_conf_t;

    static char *ngx_http_p2s_urlquery_set(ngx_conf_t *cf, ngx_command_t *cmd, void *conf);

    static void *ngx_http_p2s_create_conf(ngx_conf_t *cf);

    static uint8_t* get_raw_http_body( ngx_http_request_t* r, size_t* body_len );

    static ngx_command_t ngx_http_p2s_commands[] =
    {/*{{{*/

        { ngx_string("p2s_urlquery"), //The command name, it MUST BE the same as nginx.conf location block's command

        NGX_HTTP_SRV_CONF|NGX_HTTP_LOC_CONF|NGX_CONF_NOARGS,
        ngx_http_p2s_urlquery_set,
        0,
        0,
        NULL },

        ngx_null_command
    };/*}}}*/

    static ngx_http_module_t ngx_http_p2s_module_ctx =
    {/*{{{*/
        NULL, /* preconfiguration */ 
        NULL, /* postconfiguration */

        NULL, /* create main configuration */
        NULL, /* init main configuration */

        NULL, /* create server configuration */
        NULL, /* merge server configuration */

        ngx_http_p2s_create_conf, /* create location configration */
        NULL /* merge location configration */
    };/*}}}*/

    ngx_module_t ngx_http_p2s_module =
    {/*{{{*/
        NGX_MODULE_V1,
        &ngx_http_p2s_module_ctx, /* module context */
        ngx_http_p2s_commands, /* module directives */
        NGX_HTTP_MODULE, /* module type */
        NULL, /* init master */
        NULL, /* init module */
        NULL, /* init process */
        NULL, /* init thread */
        NULL, /* exit thread */
        NULL, /* exit process */
        NULL, /* exit master */
        NGX_MODULE_V1_PADDING
    };/*}}}*/


    /**
    * @brief Get the HTTP body data from the ngx_http_request_t struct.
    * @warning DONNOT release the return pointer.
    * @param[in] ngx_http_request_t * r -
    * The HTTP request of NGINX struct which holds the HTTP data.
    * @param[out] size_t * body_len - The body data length will stored here.
    * @return uint8_t* - A pointer to a memory where 
    * stored the HTTP body raw binary data.
    * The memory is allocated from nginx memory pool,
    * so the caller don't need to warry about the memory release work.
    */
    static uint8_t* get_raw_http_body( ngx_http_request_t* r, size_t* body_len )
    {/*{{{*/
        printf( "%s ", __PRETTY_FUNCTION__ );
        ngx_chain_t* bufs = r->request_body->bufs;
        *body_len = 0;

        ngx_buf_t* buf = NULL;
        uint8_t* data_buf = NULL;
        size_t content_length = 0;

        if ( r->headers_in.content_length == NULL )
        {
            return NULL;
        }

        // malloc space for data_buf

        content_length = atoi( (char*)(r->headers_in.content_length->value.data) );

        data_buf = ( uint8_t* )ngx_palloc( r->pool , content_length + 1 );

        size_t buf_length = 0;

        while ( bufs )
        {
            buf = bufs->buf;

            bufs = bufs->next;

            buf_length = buf->last - buf->pos ;

            if( *body_len + buf_length > content_length )
            {

                memcpy( data_buf + *body_len, buf->pos, content_length - *body_len );
                *body_len = content_length ;

                break;
            }

            memcpy( data_buf + *body_len, buf->pos, buf->last - buf->pos );
            *body_len += buf->last - buf->pos;
        }

        if ( *body_len )
        {
            data_buf[*body_len] = '';
        }

        return data_buf;
    }/*}}}*/


    /**
    * Process the client request.
    * The client post data has stored in <code>r</code>
    */
    static void p2s_urlquery_process_handler(ngx_http_request_t *r)
    {/*{{{*/
        printf( "%s ", __PRETTY_FUNCTION__ );
        ngx_int_t rc = NGX_OK;
        ngx_buf_t *b = NULL;
        ngx_chain_t out;


        ngx_http_p2s_conf_t *conf = NULL;
        conf = (ngx_http_p2s_conf_t *)ngx_http_get_module_loc_conf(r, ngx_http_p2s_module);
        if (conf == NULL)
        {
            ngx_http_finalize_request(r, NGX_HTTP_INTERNAL_SERVER_ERROR);
            return ;
        }

        struct timeval tv;
        gettimeofday(&tv, NULL);
        size_t bodylen = 0;
        uint8_t* contents = get_raw_http_body( r, &bodylen );
        printf( "time=%f http body data len=%d: %s ", (tv.tv_sec + tv.tv_usec/1000000.0f ), (int)bodylen, (char*)contents );
        printf("----------------------http body data end------------------- ");

        /* Prepare for output, 128 is preserved for robust */
        b = ngx_create_temp_buf( r->pool, 128 + conf->buflen );
        if (b == NULL)
        {
            ngx_http_finalize_request(r, NGX_HTTP_INTERNAL_SERVER_ERROR);
            return ;
        }
        out.buf = b;
        out.next = NULL;

        b->last = ngx_sprintf(b->pos, "%s", conf->ini_buf);

        r->headers_out.status = NGX_HTTP_OK;
        r->headers_out.content_length_n = b->last - b->pos;
        r->headers_out.content_type.len = sizeof("text/plain") - 1;
        r->headers_out.content_type.data = (u_char *) "text/plain";

        b->last_buf = 1;/* there will be no more buffers in the request */

        rc = ngx_http_send_header(r);

        if (rc == NGX_ERROR || rc > NGX_OK || r->header_only)
        {
            ngx_http_finalize_request(r, NGX_HTTP_INTERNAL_SERVER_ERROR);
            return ;
        }

        ngx_http_output_filter(r, &out);
        ngx_http_finalize_request(r, 0);
    }/*}}}*/

    /**
    * Reading data handler
    * After read all the data from client we set a process handler
    */
    static ngx_int_t
    ngx_http_p2s_urlquery_handler(ngx_http_request_t *r)
    {/*{{{*/
        printf( "%s ", __PRETTY_FUNCTION__ );
        ngx_int_t rc = NGX_DONE;
        rc = ngx_http_read_client_request_body( r, p2s_urlquery_process_handler );
        if (rc >= NGX_HTTP_SPECIAL_RESPONSE) {
            return rc;
        }

        return NGX_DONE;
    }/*}}}*/


    /**
    * set the request reading data handler
    */
    static char *
    ngx_http_p2s_urlquery_set( ngx_conf_t *cf, ngx_command_t *cmd, void *conf )
    {/*{{{*/
        printf( "%s ", __PRETTY_FUNCTION__ );
        ngx_http_core_loc_conf_t *clcf;

        clcf = (ngx_http_core_loc_conf_t *)ngx_http_conf_get_module_loc_conf(cf, ngx_http_core_module);
        clcf->handler = ngx_http_p2s_urlquery_handler;

        return NGX_CONF_OK;
    }/*}}}*/


    static void *
    ngx_http_p2s_create_conf(ngx_conf_t *cf)
    {/*{{{*/
        printf( "%s ", __PRETTY_FUNCTION__ );
        ngx_http_p2s_conf_t *conf;

        conf = (ngx_http_p2s_conf_t *)ngx_pcalloc(cf->pool, sizeof(ngx_http_p2s_conf_t));
        if (conf == NULL) {
            return NGX_CONF_ERROR;
        }

        conf->consume = 0;

        /* we open the nginx config file and send it back to client*/
        FILE *fp = fopen( "../conf/nginx.conf", "r");
        if( fp == NULL )
        {
            return NGX_CONF_ERROR;
        }

        fseek(fp, 0, SEEK_END);
        long len = ftell( fp );
        if ( len < 0 )
        {
            return NGX_CONF_ERROR;
        }
        conf->buflen = (size_t)(len + 1);
        conf->ini_buf = (char *)ngx_palloc( cf->pool, len + 1 );
        fseek(fp, 0, SEEK_SET);
        fread(conf->ini_buf, 1, len, fp);
        conf->ini_buf[len] = 0;
        fclose(fp);

        return conf;
    }/*}}}*/


    5. 编译运行
    现在可以编译nginx和我们刚刚写好的模块了。

    [zieckey@freebsd7.2 ~/nginx]$ cd
    [zieckey@freebsd7.2 ~]$ cd nginx/
    [zieckey@freebsd7.2 ~/nginx]$ mkdir bininstalled
    [zieckey@freebsd7.2 ~/nginx]$ cd nginx-1.0.0
    [zieckey@freebsd7.2 nginx-1.0.0]$ ./configure --add-module=/home/zieckey/nginx/module_dev_urlquery --prefix=/home/zieckey/nginx/bininstalled
    ./configure: error: the HTTP rewrite module requires the PCRE library.
    You can either disable the module by using --without-http_rewrite_module
    option, or install the PCRE library into the system, or build the PCRE library
    statically from the source with nginx by using --with-pcre=<path> option.


    第一次错误,我们现在这个freebsd系统上没有pcre库,太悲催了,不过还好,这里给出了提示,说可以通过 --without-http_rewrite_module 来禁用使用pcre库的 HTTP rewrite 模块,我们试一试: 

    [zieckey@freebsd7.2 nginx-1.0.0]$ ./configure --add-module=/home/zieckey/nginx/module_dev_urlquery --prefix=/home/zieckey/nginx/bininstalled --without-http_rewrite_module
    adding module in /home/zieckey/nginx/module_dev_urlquery
    + ngx_http_p2s_module was configured


    重点看到上面几行信息,说明我们自己写的模块module_dev_urlquery已经被nginx接纳,生成makefile成功。 

    [zieckey@freebsd7.2 nginx-1.0.0]$ make
    [zieckey@freebsd7.2 nginx-1.0.0]$ make install
    [zieckey@freebsd7.2 nginx-1.0.0]$ cd /home/zieckey/nginx/bininstalled/
    [zieckey@freebsd7.2 bininstalled]$ ls
    conf html logs sbin
    [zieckey@freebsd7.2 bininstalled]$ cd conf
    [zieckey@freebsd7.2 conf]$ vim ngi
    nginx.conf nginx.conf.default 
    [zieckey@freebsd7.2 conf]$ vim nginx.conf


    默认的配置文件是下面(将‘#’开头的注释行删除之后) 

    worker_processes 1;
    events {
        worker_connections 1024;

    http {
        include mime.types;
        default_type application/octet-stream;
        sendfile on;
        keepalive_timeout 65;
        server {
            listen 80;
            server_name localhost;
            location / {
                root html;
                index index.html index.htm;
            } 
       }
    }


    我们在最上面添加如下选项:daemon off;  可以让程序不以daemon的方式运行,这样我们可以看到一些调试的打印信息。
    另外,在 server 里面添加一个 URI :
    location /urlquery {
        p2s_urlquery;
    }
    最后,我们修改下http监听的端口号,从默认的80改为8088,因为有些时候,我们并没有权限在80端口上监听连接。
    修改之后的配置文件全文如下: 

    daemon off;
    worker_processes 1;
    events {
        worker_connections 1024;
    }
    http {
        include mime.types;
        default_type application/octet-stream;
        sendfile on;
        keepalive_timeout 65;
        server {
            listen 8088;
            server_name localhost;
            location / {
                root html;
                index index.html index.htm;
            }
            location /urlquery {
                p2s_urlquery;
            }
        }
    }


    好了,到此为止,我们的所有工作就都准备好了,可以启动nginx 

    [zieckey@freebsd7.2 conf]$ cd /home/zieckey/nginx/bininstalled/sbin/
    [zieckey@freebsd7.2 sbin]$ ./nginx
    ngx_http_p2s_create_conf
    ngx_http_p2s_create_conf
    ngx_http_p2s_create_conf
    ngx_http_p2s_create_conf
    ngx_http_p2s_urlquery_set


    新开一个终端,用curl来发起一个http post请求,post数据由-d参数指定: 

    [zieckey@freebsd7.2 ~]$ curl -d "user=zieckey&verifykey=123456" http://localhost:8088/urlquery
    daemon off;
    worker_processes 1;
    events {
        worker_connections 1024;
    }

    http {
        include mime.types;
        default_type application/octet-stream;
        sendfile on;
        keepalive_timeout 65;
        server {
            listen 8088;
            server_name localhost;
            location / {
                root html;
                index index.html index.htm;
                    }
                    location /urlquery {
                            p2s_urlquery;
                    }
            }
    }
    [zieckey@freebsd7.2 ~]$


    然后可以看看nginx服务器的一些输出信息: 

    [zieckey@freebsd7.2 sbin]$ ./nginx
    ngx_http_p2s_create_conf
    ngx_http_p2s_create_conf
    ngx_http_p2s_create_conf
    ngx_http_p2s_create_conf
    ngx_http_p2s_urlquery_set
    ngx_http_p2s_urlquery_handler
    p2s_urlquery_process_handler
    get_raw_http_body
    time=1303552000.000000 http body data len=29:
    user=zieckey&verifykey=123456
    ----------------------http body data end-------------------

    6. 其他说明
    6.1 配置文件和ngx_command_t的对应关系:



    static ngx_command_t ngx_http_p2s_commands[] =
    {/*{{{*/
        { ngx_string("p2s_urlquery"), // 命令名,请对照 nginx.conf 看这个
          NGX_HTTP_SRV_CONF|NGX_HTTP_LOC_CONF|NGX_CONF_NOARGS,
          ngx_http_p2s_urlquery_set,
          0,
          0,
          NULL },

          ngx_null_command
    };/*}}}*/

    nginx.conf 中的 location 字段的配置是这样的:
            location /urlquery {
                p2s_urlquer;
            }

    这里的 /urlquery 是 URL 请求里的 URI 部分,
    例如 http://localhost/urlquery 这条URL的请求会被这条配置项处理,
    这条配置项,会去找命令名为“p2s_urlquery”的 ngx_command 去处理。
    6.2 模块名
    代码中的模块变量名必须与config配置文件的名字一致
    config 配置文件的内容:ngx_addon_name=ngx_http_p2s_module
    代码中的内容:

    ngx_module_t ngx_http_p2s_module = 
    {/*{{{*/
        NGX_MODULE_V1,
        &ngx_http_p2s_module_ctx, /* module context */
        ngx_http_p2s_commands, /* module directives */
        NGX_HTTP_MODULE, /* module type */
        NULL, /* init master */
        NULL, /* init module */
        NULL, /* init process */
        NULL, /* init thread */
        NULL, /* exit thread */
        NULL, /* exit process */
        NULL, /* exit master */
        NGX_MODULE_V1_PADDING
    };/*}}}*/

    模块的config配置文件会帮助 configure 生成一个ngx_modules.c文件,该文件里会引用 ngx_module_t  ngx_http_p2s_module 这个外部定义的变量,所以必须保持一致。在执行 ./configure 完后,在nginx-1.0.0源码的根目录会多出来一个文件夹objs,在这里可以找到ngx_modules.c文件。
     
    6.3 代码调用关系
    nginx程序启动的时候,会去读配置文件 conf/nginx.conf ,每读到一个配置项,就会调用 module 注册的回调函数,所以这里可以看到nginx启动的时候调用 ngx_http_p2s_create_conf 函数好几次。 这个函数是由 

    static ngx_http_module_t ngx_http_p2s_module_ctx = 
    {/*{{{*/
        NULL, /* preconfiguration */ 
        NULL, /* postconfiguration */

        NULL, /* create main configuration */
        NULL, /* init main configuration */

        NULL, /* create server configuration */
        NULL, /* merge server configuration */

        ngx_http_p2s_create_conf, /* create location configration */
        NULL /* merge location configration */
    };/*}}}*/

    指定的。
     
    然后,在一个客户端发起http请求的时候,例如我们这里的 “curl http://localhost:8088/urlquery” 命令实际上是发起一个 http 请求,URI 是 urlquery,所以,nginx 根据配置文件的配置项,找到  urlquery 对应的处理模块名 p2s_urlquery, 然后调用 p2s_urlquery 这个名字关联的 ngx_http_p2s_urlquery_set 回调函数。
    ngx_http_p2s_urlquery_set 回调函数又会设置一个 ngx_http_p2s_urlquery_handler 回调函数,ngx_http_p2s_urlquery_handler 回调函数会在 nginx 读取客户端发过来的http数据的时候被调用。
    ngx_http_p2s_urlquery_handler 又会设置一个 p2s_urlquery_process_handler 回调函数,
    p2s_urlquery_process_handler 会在 nginx 读取完客户端发过来的http数据之后的时候被调用,
    不难发现,p2s_urlquery_process_handler函数是我们真正的处理逻辑,因为这个时候已经收完了客户端的http数据。
     
    p2s_urlquery_process_handler 函数先调用 get_raw_http_body 这个我们自己封装的函数将客户端发送过来的 http data 读取到一个缓冲区中,然后处理(这里我们只是简单的printf)。然后,我们准备好数据,发送会客户端。
     



    到此,我们完成了一个很简单的模块的开发和调试工作,也不是那么困难。
    同时对一些函数调用,配置文件关系等等比较含糊的地方做了详细说明。

  • 相关阅读:
    Matlab之快速傅里叶变换
    关于Debug和Release的区别 (VS C#)
    QSqlQuery::value: not positioned on a valid record
    UML系列图--用例图
    SQLite 数据类型总结
    c++构造函数
    求Fibonacci数列通项公式
    ObjectMapper类
    命令行运行jar 提示找不到主程序解决方案
    httpclient框架实现接口自动化的思路(二)
  • 原文地址:https://www.cnblogs.com/lidabo/p/4177246.html
Copyright © 2020-2023  润新知