使用非阻塞IO的应用程序经常使用select,poll,epoll系统调用;它们的功能本质上是一样的:都允许进程决定是否可以对一个或者多个打开的文件做非阻塞的读取或者写入;这些电泳也会阻塞进程,直到给定的文件描述符中的任何一个可读取或者写入;因此,它们常常用于那些需要使用多个输入或者输出流而又不会阻塞于其中任何一个流的应用程序中;同一功能之所以要由多个独立的函数提供,是因为其中两个几乎是由两个不同的Unix团体分别实现的:select在BSD中引入,而poll由SystemV引入;epoll系统调用则用于将poll函数扩展到能够处理数千个文件描述符;
poll在file_operations结构中的定义如下:
1 unsigned int (*poll) (struct file *, struct poll_table_struct *);
1
|
unsigned int (*poll) (struct file *, struct poll_table_struct *);
|
当用户空间程序在驱动程序关联的文件描述符上执行select,poll,epoll系统调用时,该驱动程序的方法将被调用;该poll函数的功能分为两步:
1. 在一个或者多个可指示poll状态变化的等待队列上调用poll_wait;如果当前没有文件描述符可用来执行IO,则内核将进程在传递到该系统调用的所有文件描述符对应的等待队列上等待;
1 static inline void poll_wait(struct file * filp, wait_queue_head_t * wait_address, poll_table *p)
2. 返回一个用来描述操作是否可以立即无阻塞执行的位掩码;
POLLIN-如果设备可以无阻塞的读取,就设置该位;
POLLRDNORM-如果通常的数据已经就绪,就可以读取,就应该设置该位;一个可读设备返回POLLIN|POLLRDNORM;
POLLRDBAND-指示可以从设备读取out-of-band带外数据;
POLLPRI-可以无阻塞的读取高优先级(即out-of-band)的数据;设置该位会导致select报告文件发生一个异常,这是由于select把out-of-band数据作为异常对待;
POLLHUP-当读取设备的进程到达文件尾时,驱动程序必须设置POLLHUP位,调用select的进程会被告知设备是可读的;
POLLERR-设备发生了错误;如果调用poll,就会报告设备既可以读也可以写,因为读写都会无阻塞的返回一个错误码;
POLLOUT-如果设备可以无阻塞的写入,就在返回值中设置该位;
POLLWRNORM-该位和POLLOUT的意义一样,有时其实就是同一个数字;一个可写的设备将返回POLLOUT|POLLWRNORM;
POLLWRBAND-与POLLRDBAND类似,这一位标识具有非零优先级的数据可以被写入设备;只有数据报的poll实现中使用了这一位,因为数据报可以传输out-of-band数据;
POLLRDBAND和POLLWRBAND只在于套接字相关的文件描述符中才有意义,设备驱动程序通常用不到这两个标记;
随意从内核摘取了一段代码,对上面描述的两个步骤体现的很明确;
1 static unsigned int evdev_poll(struct file *file, poll_table *wait) 2 { 3 struct evdev_client *client = file->private_data; 4 struct evdev *evdev = client->evdev; 5 unsigned int mask; 6 7 poll_wait(file, &evdev->wait, wait); 8 9 if (evdev->exist && !client->revoked) 10 mask = POLLOUT | POLLWRNORM; 11 else 12 mask = POLLHUP | POLLERR; 13 14 if (client->packet_head != client->tail) 15 mask |= POLLIN | POLLRDNORM; 16 17 return mask; 18 }