前面讲了lighttpd的插件系统,这一篇将看一看lighttpd中的fdevent系统。fdevent系统主要是处理各种IO事件,在web服务器中,主要就是向socket写数据和从socket读数据。通常,web服务器是IO密集型程序,这就要求在数据的读写上,web服务器必须能够具有很好的性能,不会因为某个socket的阻塞而致使其他socket也被阻塞,否则会大大降低服务器的性能。因此,大部分的web服务器都采用非阻塞IO进行数据的读写。lighttpd通过fdevent系统,采用类似OO中面向对象的方式将对IO事件的处理进行封装,对于不同的IO系统,提供一个统一的接口。
lighttpd采用了所谓的Reactor模式,也就是非阻塞IO加多路复用(non-blocking IO + IO multiplexing)。在多路复用上,lighttpd通过fdevent将各种不同的实现进行封装。lighttpd使用的多路IO有如下几个:
下面看一下fdevent.h中fdevents结构体,这个结构体相当于是一个虚基类,其中的函数指针是纯虚函数。对于每种实现,则相当于是继承了这个基类并实现了其中的纯虚函数,也就是给函数指针赋一个函数地址值。下面是代码:
typedef struct fdevents { fdevent_handler_t type; //多路IO类型 fdnode **fdarray; //文件描述符数组 size_t maxfds; //最大的文件描述符数 #ifdef USE_LINUX_SIGIO int in_sigio; int signum; sigset_t sigset; siginfo_t siginfo; bitset *sigbset; #endif #ifdef USE_LINUX_EPOLL int epoll_fd; struct epoll_event *epoll_events; #endif #ifdef USE_POLL struct pollfd *pollfds; //描述符及其状态的结构体数组 size_t size; //数组中数据的个数 size_t used; //数组的大小 //用于存储pollfds中为使用的位置。 //由于可能的删除操作,会是pollfds中存在空档,将这些空档 //的索引存在unused中,便于下次插入操作时直接使用这些空档 //减少空间的浪费。 buffer_int unused; #endif #ifdef USE_SELECT //三个文件描述符集合 fd_set select_read; //可读,对应FDEVENT_IN fd_set select_write; //可写,对应FDEVENT_OUT fd_set select_error; //处于异常条件,对应FDEVENT_ERR //由于select函数会修改上面的三个集合, //因此,在这里保存一个初始的副本。 fd_set select_set_read; fd_set select_set_write; fd_set select_set_error; int select_max_fd; //最大的文件描述符数。 #endif #ifdef USE_SOLARIS_DEVPOLL int devpoll_fd; struct pollfd *devpollfds; #endif #ifdef USE_FREEBSD_KQUEUE int kq_fd; struct kevent *kq_results; bitset *kq_bevents; #endif #ifdef USE_SOLARIS_PORT int port_fd; #endif //统一的操作接口,与后面的函数声明对应。 int (*reset) (struct fdevents * ev); void (*free) (struct fdevents * ev); int (*event_add) (struct fdevents * ev, int fde_ndx, int fd, int events); int (*event_del) (struct fdevents * ev, int fde_ndx, int fd); int (*event_get_revent) (struct fdevents * ev, size_t ndx); int (*event_get_fd) (struct fdevents * ev, size_t ndx); int (*event_next_fdndx) (struct fdevents * ev, int ndx); int (*poll) (struct fdevents * ev, int timeout_ms); int (*fcntl_set) (struct fdevents * ev, int fd); } fdevents;
可以看到这个结构体中使用很多宏,这是为了在编译的时候去掉那些没有使用到的变量,根据当前所使用的多路IO系统,对这个结构体进行定制。
结构体的第一个成员是一个枚举类型fdevent_handler_t,定义如下:
typedef enum { FDEVENT_HANDLER_UNSET, //未定义 FDEVENT_HANDLER_SELECT, //select FDEVENT_HANDLER_POLL, //poll FDEVENT_HANDLER_LINUX_RTSIG, //rtsig FDEVENT_HANDLER_LINUX_SYSEPOLL, //sysepoll FDEVENT_HANDLER_SOLARIS_DEVPOLL, //devpoll FDEVENT_HANDLER_FREEBSD_KQUEUE, //kqueue FDEVENT_HANDLER_SOLARIS_PORT //port } fdevent_handler_t;
这个枚举类型标记了所有可能用到的多路IO系统。
结构体中的第二个成员fdnode **fdarray;,是一个fdnode类型变量的数组。fdnode的定义如下:
typedef struct _fdnode { fdevent_handler handler; //处理函数指针 void *ctx; //文件描述符的context int fd; //文件描述符 struct _fdnode *prev, *next; //指针 } fdnode;
fdevent_handler handler是一个函数指针,用来存储这个描述符处理函数的地址。关于这个地址,后面的文章中将会有详细的介绍,其定义为typedef handler_t(*fdevent_handler) (void *srv, void *ctx, int revents);。从最后两个变量可以看出,这应该是一个链表的节点,但是,这个结构体是以数组的形式存储的,也就是fdevents中的fdarray变量,这样可以提高查询的效率。
后面由宏包裹的变量就是对于各个不同的多路IO系统定义的变量。我们着重看一看linux下的epoll所使用的变量:
#ifdef USE_LINUX_EPOLL int epoll_fd; //epoll_create返回的描述符 struct epoll_event *epoll_events;//保存fd及对应的事件 #endif
这里要说明一下poll使用的变量buffer_init unused。这个变量的类型的定义如下:
typedef struct { int *ptr; //位置索引数组。 size_t used; //数组中数据个数。 size_t size; //数组长度。 } buffer_int;
其实就是一个int数组,只不过封装了一下,增加了两个属性。unused数组中存放的是pollfds的下标值。在后面的实现中我们可以看到,pollfds是一个struct pollfd类型数组,注意,不是这个类型的指针的数组。这个数组的大小是根据fdevents中的maxfds的值定的,并且在初始化的时候数组的空间也一次性分配好。由于对pollfds数组有删除元素的操作,因此,会在数组中留下“洞”,而ununsd就是存储这些“洞”的下标值,便于在插入元素时,快速的找到位置。这是一个很有用的技巧,在对数据进行反复的删除插入元素操作时,可以提高效率。大多数情况下使用栈链表来存储这些可用空间的下标,栈顶指向链表头。
其余的变量读者可自行分析。
接下来看看这些函数指针。这些函数指针对应与结构体定义后面的一系列函数声明。从名字中可以轻易的看出对应关系。
/* * 重置和释放fdevent系统。 */ int fdevent_reset(fdevents * ev); void fdevent_free(fdevents * ev); /* * 将fd增加到fd event系统中。events是要对fd要监听的事件。 * fde_ndx是fd对应的fdnode在ev->fdarray中的下标值的指针。 * 如果fde_ndx==NULL,则表示在fd event系统中增加fd。如果不为NULL,则表示这个 * fd已经在系统中存在,这个函数的功能就变为将对fd监听的事件变为events。 */ int fdevent_event_add(fdevents * ev, int *fde_ndx, int fd, int events); /* * 从fd event系统中删除fd。 fde_ndx的内容和上面的一致。 */ int fdevent_event_del(fdevents * ev, int *fde_ndx, int fd); /* * 返回ndx对应的fd所发生的事件。 * 这里的ndx和上面的fde_ndx不一样,这个ndx是ev->epoll_events中epoll_event结构体的下标。 * 第一次调用的时候,通常ndx为-1。 * 这个ndx和其对应的fd没有关系。而fde_ndx等于其对应的fd。 */ int fdevent_event_get_revent(fdevents * ev, size_t ndx); /* * 返回ndx对应的fd。 */ int fdevent_event_get_fd(fdevents * ev, size_t ndx); /* * 返回下一个发生IO事件的fd。 */ int fdevent_event_next_fdndx(fdevents * ev, int ndx); /* * 开始等待IO事件。timeout_ms是超时限制。 */ int fdevent_poll(fdevents * ev, int timeout_ms); /** * 设置fd的状态,通常是设置为运行exec在子进程中关闭和非阻塞。 */ int fdevent_fcntl_set(fdevents * ev, int fd);
在fdevent.c文件中,这些函数的实现基本上都是简单的调用fdevents结构体中对应的函数指针。对于lighttpd,通过调用上面的这些函数完成IO事件的处理,对于具体到底是谁处理了这些事件,lighttpd并不知道,也不关心。
剩下的函数声明:
/* * 返回fd对应的事件处理函数地址。也就是fdnode中handler的值。 */ fdevent_handler fdevent_get_handler(fdevents * ev, int fd); /* * 返回fd对应的环境。也就是fdnode中ctx的值。 */ void *fdevent_get_context(fdevents * ev, int fd); /* * 注册和取消注册fd。 * 就是生成一个fdnode,然后保存在ev->fdarray中。或者删除之。 */ int fdevent_register(fdevents * ev, int fd, fdevent_handler handler, void *ctx); int fdevent_unregister(fdevents * ev, int fd); /** * 初始化各种多路IO。 */ int fdevent_select_init(fdevents * ev); int fdevent_poll_init(fdevents * ev); int fdevent_linux_rtsig_init(fdevents * ev); int fdevent_linux_sysepoll_init(fdevents * ev); int fdevent_solaris_devpoll_init(fdevents * ev); int fdevent_freebsd_kqueue_init(fdevents * ev);
下面总结一下:
文件fdevent.h中声明的一系列函数就是fdevent系统对外的接口,这相当与类的公有函数。lighttpd通过调用这些函数来实现IO事件的处理。在这些函数的具体实现仅仅是简单的调用了fdevents结构体中的函数指针。而这写函数指针所对应的函数分别定义在以fdevent_开头的.c文件中。从这些文件的名字可以看出其所对应的IO系统。在这些文件中,函数大多是static,这就行当与类的私有函数,起到隐藏具体实现的效果。后面的问装中我们会具体的分析一个多路IO系统的使用。
lighttpd作者对fdevent系统封装相当的出彩,对于理解在C中使用面向对象的方式编程具有很好的帮助。
下一篇中将看一看fdevent系统的初始化和使用。
本文章由http://www.wifidog.pro/2015/04/20/wifidog%E6%BA%90%E7%A0%81%E5%88%86%E6%9E%90lighttpd%E5%AF%B9%E5%A4%96%E6%8E%A5%E5%8F%A3.html整理编辑,转载请注明出处