“信号量内核对象”用于对资源进行计数。
在信号量内核对象内部,和其他内核对象一样,有一个使用计数,该使用计数表示信号量内核对象被打开的次数。
信号量内核对象中还有两个比较重要的数据,分别表示最大资源数和当前资源数。最大资源数表示能够管理的资源的总数,当前资源数表示目前可以被使用的资源数量。
可以使用CreateSeamphore函数来创建一个信号量内核对象,该函数成功返回句柄,失败返回NULL。
HANDLE CreateSemaphore(
PSECURITY_ATTRIBUTE psa, //安全属性结构指针
LONG lInitialCount, //初始可用资源数
LONG lMaximumCount, //最大资源数
PCTSTR pszName); //信号量内核对象的名字(NULL表示匿名)
在Windows Vista中,提供了一个新的创建信号量内核对象的函数CreateSemaphoreEx,该函数成功返回句柄,失败返回NULL。
HANDLE CreateSemaphoreEx(
PSECURITY_ATTRIBUTES psa, //安全属性结构指针
LONG lInitialCount, //初始可用资源数
LONG lMaximumCount, //最大资源数
PCTSTR pszName, //信号量内核对象的名字(NULL表示匿名)
DWORD dwFlags, //保留型参数,应设置为0
DWORD dwDesiredAccess); //访问限制(参看MSDN)
同样,可以打开一个指定名称的信号量,使用OpenSemaphore函数:
HANDLE OpenSemaphore(
DWORD dwDesiredAccess, //访问限制(参看MSDN)
BOOL bInheritHandle, //是否允许返回的句柄子进程被继承
PCTSTR pszName); //指定的信号量名称
假如,作为一个服务器,有一个缓冲区需要用来存放客户的连接请求,还有一个线程池用来处理连接。但是该缓冲区和线程池的大小有限,比如至多只能同时接纳和处理10位客户的连接请求,而当有10位客户请求连接而尚未处理完成的时候,此时一个新客户也试图建立连接,那么这个连接过程应该被推后,直到有一个连接处理完成之后,这个新客户的连接才能被处理。
这个时候,可以使用信号量机制来处理线程同步的问题。
当服务器初始化的时候,最大资源数为10,没有任何服务器请求连接,可以使用如下代码创建信号量内核对象:
HANDLE hSem = CreateSemaphore(NULL, 0, 10, NULL);
该函数创建了一个信号量内核对象,最大资源数为10,当前可用资源数为0。由于当前可用资源数为0,所以调用WaitForSingleObject等这些等待函数来等待该信号量句柄的线程都会进入等待状态。
这些等待函数在内部会查看信号量内核对象的可用资源数,如果该值大于0,则将其减1,线程保持可调度状态,这些比较和设置可用资源数是以原子过程进行的,所以是线程安全的。
如果可用资源数等于0,则线程进入等待状态,当一个线程将信号量的可用资源数递增之后,某个或某些等待的线程就可以进入就绪状态。
可以调用ReleaseSemaphore函数来让信号量内核对象的可用资源数递增:
BOOL ReleaseSemaphore(
HANDLE hSemaphore, //信号量内核对象句柄
LONG lReleaseCount, //可用资源增加个数
PLONG plPreviousCount); //返回上次可用资源的数量,一般传递NULL忽略之
可惜的是,Windows没有提供一种方法让我们仅仅是查询当前信号量的可用资源数。
自己总结了一下信号量使用的模型:
HANDLE g_hSem; //信号量句柄,在其他线程(比如主线程)中创建
DWORD WINAPI ThreadProc(PVOID pvParam) //线程函数
{
//等待信号量,如果可用资源大于0,递减资源,线程继续运行,否则线程等待
WaitForSingleObject(g_hSem, INFINITE);
//访问资源
//访问完毕,释放,递增可用资源数1个(可以根据需要递增n个)
ReleaseSemaphore(g_hSem, 1, NULL);
}
互斥内核对象确保一个线程独占地访问资源。
互斥内核对象的行为特征和关键代码段有点类似,但是它是属于内核对象,而关键代码段是用户模式对象,这导致了互斥内核对象的运行速度比关键代码段要低。所以,在考虑线程同步问题的时候,首先考虑用户模式的对象。
但是,互斥内核对象可以跨进程使用,当需要实现多进程之间的线程同步,就可用考虑使用互斥内核对象。而这点,关键代码段无能为力。
在互斥内核对象内部,有以下一些重要的数据:
1、使用计数:表明该互斥内核对象被打开的次数。
2、线程ID
3、递归计数器
线程ID表明了该互斥内核对象被哪个线程所拥有,递归计数器表明了这个线程(拥有互斥对象)拥有这个互斥对象的次数。
互斥对象的使用规则如下
- 如果内部线程ID为0(或者是一个无效的线程ID),该互斥内核对象不被任何线程所拥有,会发出通知信号,即处于“已通知”状态。
- 如果线程ID不为0,而是一个有效的线程ID,那么该互斥内核对象就被这个线程所拥有,而且该互斥内核对象为“未通知”状态。
- 与其他内核对象不同的是,互斥内核对象在操作系统中有着特殊的代码,允许以不正常的规则进行使用。
设备的输入输出,即设备I/O,可以分为“同步”和“异步”两种方式。同步的设备I/O,调用的API函数总是等到设备I/O完成才返回。而异步的设备I/O,可以通过多种方法来实现,但是其根本原理是得到“设备I/O的完成通知”。
本篇主要讨论如何打开和关闭一个设备。注意,这里的设备,不是指像键盘、显示器那种实体。而是一种抽象的概念,指一种与外界通信的对象,可以接受外界的输入,也可以对外界的请求作出响应,称之为设备I/O。这个概念比较抽象,这些设备往往和某个内核对象关联。要打开这些设备,就要创建相关的内核对象。
这些设备包括文件、目录、逻辑磁盘驱动、物理磁盘驱动、串行端口、并行端口、邮槽、管道、套接字、控制台(如下表):
设备
|
主要用途
|
文件
|
保存数据
|
目录
|
属性和文件压缩设置
|
逻辑磁盘驱动
|
磁盘格式化
|
物理磁盘驱动
|
访问分区表
|
串行端口
|
串行传输数据
|
并行端口
|
多位数据同时传输,主要是将数据传输给打印机
|
邮槽
|
一对多传输数据,往往适用于一个网络中的一台计算机向其他机器发送数据
|
命名管道
|
一对一传输数据,往往适用于一个网络中的一台计算机向其他机器发送数据
|
匿名管道
|
一对一传输数据,适用于简单的数据传输,不适用于网络
|
套接字
|
以流或数据报的形式发送数据,适用于一个网络中的通信
|
控制台
|
一个文字窗口显示缓冲区
|
要使用这些设备,你首先应该打开这些设备。
Windows努力隐藏这些设备的差异,所以,很多设备的打开的I/O工作可以通过同一个API函数完成,如下表:
设备
|
经常用来打开设备的API函数和用法
|
文件
|
CreateFile —— 打开设备的函数。
将参数pszName是一个文件路径名。
|
目录
|
CreateFile —— 打开设备的函数。
将参数pszName是一个目录名。Windows允许你打开一个目录,通过使用参数FILE_ FLAG_BACKUP_SEMANTICS旗标来呼叫CreateFile函数。打开目录之后,就可以这是目录属性,即文件夹属性,比如正常、隐藏、系统、只读等。
|
逻辑磁盘驱动
|
CreateFile —— 打开设备的函数。
将参数pszName设置为字符串“\\.\x:”。 比如要打开C盘,就将其设置为“\\.\C:”。
|
物理磁盘驱动
|
CreateFile —— 打开设备的函数。
将参数pszName设置为“\\.\PHYSICALDRIVEx”。比如打开第一个物理硬盘扇区:可以这么调用CreateFile函数:
CreateFile(TEXT("\\.\PHYSICALDRIVE0"), ...);
这样就可以打开一个物理磁盘驱动,并且可以直接访问硬盘分区表。
但是打开物理磁盘驱动是存在潜在危险的,特别是当错误的写入,会造成物理磁盘内容的破坏。
|
串行端口
|
CreateFile —— 打开设备的函数。
将参数pszName设置为“COMx”,比如打开COM1串口设备,只要将其设置为“COM1”。
|
并行端口
|
CreateFile —— 打开设备的函数。
将参数pszName设置为“LPTx”,比如打开LPT1并行端口,将其设置为“LPT1”。
|
邮槽(服务器端)
|
CreateMailslot —— 打开设备的函数。
将参数pszName设置为“\\.\mailslot\mailslotname”,其中,“mailsoltname”是为邮槽取的名字,可以任意,前面的字符串是固定的。
|
邮槽(客户端)
|
CreateFile —— 打开设备的函数。
将参数pszName设置为“\\servername\mailslot\mailslotname”,其中,“mailsoltname”是为邮槽取的名字,可以任意,前面的字符串是固定的。
|
命名管道
(服务器端)
|
CreateFile —— 打开设备的函数。
将参数pszName设置为“\\.\pipe\pipename”,其中,“pipename”是为命名管道取的名字,可以任意,前面的字符串是固定的。
|
命名管道
(客户端)
|
CreateFile —— 打开设备的函数。
将参数pszName设置为“\\servername\pipe\pipename”,其中,“pipename”是为命名管道取的名字,可以任意,前面的字符串是固定的。
|
匿名管道
|
CreatePipe —— 打开设备的函数。
无论是客户端还是服务器端都以该函数创建或打开匿名管道。
|
套接字
|
socket —— 创建一个套接字描述符accept, or AcceptEx.
|
控制台
Console
|
CreateConsoleScreenBuffer,GetStdHandle —— 打开设备的函数
|
从上表可以发现,很多设备都以CreateFile函数来创建和打开。这个函数以后会讲。
打开了设备,你得到了一个设备的句柄,你就可以通过该句柄使用其他函数,来对相关设备进行设置。
比如,现在打开了一个串行端口,然后要设置它的传输波特率:
BOOL SetCommConfig(
HANDLE hCommDev,
LPCOMMCONFIG pCC,
DWORD dwSize);
或者,你获得了一个邮槽句柄,可以设置读取数据的等待时间:
BOOL SetMailslotInfo(
HANDLE hMailslot,
DWORD dwReadTimeout);
最后,不要忘记关闭句柄,从而正确地关闭设备:
BOOL CloseHandle(HANDLE hObject);
int closesocket(SOCKET s); //套接字的关闭
如果你有了一个设备句柄,你可以调查它的设备类型,通过使用GetFileType函数,该函数的返回值表明了它是一个什么类型的设备,可以参考MSDN。
DWORD GetFileType(HANDLE hDevice);
好了,现在让我们来讨论一下CreateFile函数:
HANDLE CreateFile(
PCTSTR pszName, //指明设备类型或一个特定的设备实体
DWORD dwDesiredAccess, //访问限制
DWORD dwShareMode, //共享方式
PSECURITY_ATTRIBUTES psa, //安全描述结构
DWORD dwCreationDisposition, //创建和打开方式
DWORD dwFlagsAndAttributes, //属性旗标,与缓冲区和文件操作属性有关
HANDLE hFileTemplate); //设备模版,一个设备句柄
该函数成功,返回句柄,失败返回INVALID_HANDLE_VALUE(值为-1)。
如果设置了最后一个参数hFileTemplate,那么就照着这个参数所代表的设备,创建一个属性相同的设备,当然,这个参数所表示的设备要具有“可读”的权限,即有GENERIC_READ访问权限。
至于该函数的具体用法,可以参看本书或MSDN。
要使用互斥内核对象,首先必须创建它:
HANDLE CreateMutex(
PSECURITY_ATTRIBUTES psa, //安全属性
BOOL bInitialOwner, //互斥对象是否开始就被调用该函数的线程所拥有
PCTSTR pszName); //该互斥内核对象的名字
Windows Vista中还提供了一个函数用于创建一个互斥内核对象:
HANDLE CreateMutexEx(
PSECURITY_ATTRIBUTES psa, //安全属性
PCTSTR pszName, //该互斥内核对象的名字
DWORD dwFlags, //互斥对象是否开始就被调用该函数的线程所拥有
DWORD dwDesiredAccess); //访问限制
第1个函数中的bInitialOwner参数如果为TRUE,则创建的互斥内核对象一开始就被调用这个函数的线程所拥有,它的线程ID被设置为该线程的ID,递归计数器被设置为1。
如果传递FALSE给这个参数,则互斥内核对象的线程ID和递归计数器被设置为0,表明该互斥内核对象不被任何线程所拥有,该互斥内核对象处于“已通知”状态。
第2个函数的dwFlags的意义和第1个函数的bInitialOwner参数其实是一样的,0就好比FALSE,CREATE_MUTEX_INITIAL_OWNER就相当于TURE。
这两个函数成功,返回互斥内核对象的句柄,失败返回NULL。
你通过“名字”来可以打开一个已经创建了的互斥内核对象:
HANDLE OpenMutex(
DWORD dwDesiredAccess, //访问限制
BOOL bInheritHandle, //是否允许返回的句柄被子进程继承
PCTSTR pszName); //名字
创建了一个互斥内核对象,得到了它的句柄之后,就可以让它保护资源了。
一个线程中(下面用T表示),在你需要访问资源之前,可以先调用“等待函数”,传递该互斥对象(下面用M表示)的句柄该这些等待函数,在等待函数内部,通过句柄查看M的线程ID,如果不为0,表明M处于“未通知”状态,线程T进入等待状态(有例外,下面会讲)。此时系统会记住这个情况,当M被其他线程释放,它的线程ID重新被设置为0的时候,系统会将一个等待在它上面的线程(比如T)的ID设置为M的线程ID,同时将M的递归计数器设置为1,允许该线程(比如T)进入可调度状态。
注意,对于互斥对象的线程ID的比较和设置都是以“原子”的形式进行的,所以互斥内核对象是“线程安全”的。
下面来讲那个例外的情况,这就是互斥内核对象允许以不正常的规则进行使用。也就是在一个互斥内核对象处于“未通知”状态的时候,一个等待在它上面的线程“或许”可以继续运行。
比如当前有一个处于“未通知状态”的互斥内核对象M,一个线程T(ID为X)。T调用等待函数等待M,这种情况下,通常T会进入等待状态。但是,系统查看T的ID和M的线程ID相同,都是X的情况下,线程并不会进入等待状态,而是保持在可调度状态。在线程成功等待互斥内核对象之后,互斥内核对象M的递归计数器加1。
也就是说,一个互斥内核对象的递归计数器要大于1,就要让线程多次等待相同的互斥内核对象。
一旦当前线程成功地等待到了一个互斥内核对象之后,该线程就可以独占某些资源,从而可以访问这些共享的资源了。试图访问这些资源的其他线程通过等待相同的互斥对象,就会进入等待状态之中。
当前线程如果对资源访问结束,必须释放互斥内核对象,使用ReleaseMutex函数:
BOOL ReleaseMutex(HANDLE hMutex); //参数是互斥内核对象句柄
该函数将互斥内核对象的递归计数减1。如果一个线程多次成功地等待一个互斥内核对象,就要同样以相同的次数调用ReleaseMutex函数,从而递减其递归计数,当互斥内核对象的递归计数减为0后,其线程ID被设置为0,进入“已通知”状态。
当这个互斥内核对象进入“已通知”状态之时,系统查看当前是否有线程等待它,如果有,就以公平的原则选择其中一个线程,将这个互斥内核对象的线程ID设置为这个选中的线程的线程ID,互斥对象的递归计数被设置为1。
综合上面所叙述的,可以总结出,互斥内核对象不同于其他内核对象,就是它有一个“线程所有权”的概念,这就使得互斥内核对象比较特殊。
一个线程调用ReleaseMutex函数释放一个互斥对象,这时系统查看互斥对象的线程ID和这个线程的线程ID是否相同,如果相同,互斥对象的递归计数减1;否则ReleaseMutex不做任何工作,返回FALSE。
还有一种现象,称做“互斥对象被抛弃”。
假设一个互斥内核对象为一个线程所拥有,而这个线程却因为某些特殊的原因在终止,比如调用了ExitThread或TerminateThread函数,但是它在终止之前没有释放这个互斥对象。这个时候,系统能够跟踪拥有互斥内核对象的线程内核对象,系统知道这个互斥对象被一个线程抛弃了,就将互斥对象的线程ID设置为0, 将其递归计数设置为0。然后,系统查看是否有其他线程在等待这个互斥对象,如果有,就公平地选中一个,将互斥对象的线程ID设置为选中的线程的线程ID,这和前面的论述是一样的,差别是等待函数返回的值是WAIT_ABANDONED,而不是WAIT_OBJECT_0。这个时候,访问资源是不合适的,因为不知道资源处于何种状态。
本来不打算写这篇的,但是文件的重要性大家都知道。在设备I/O中,有一种设备叫文件设备,这是一个抽象的概念,就把它理解为文件就行了。
文件设备,可以通过CreateFile函数打开,得到一个文件对象句柄。
在文件中,有两个比较重要的属性:
1、文件大小:在32位中最大为4GB,64位中可以达到16EB。
2、文件读写指针:这个指针表明读写位置,大小范围可以超出文件的大小。
先讨论文件的大小。
要得到文件的大小,可以使用GetFileSizeEx函数:
BOOL GetFileSizeEx(
HANDLE hFile, //文件对象句柄
PLARGE_INTEGER pliFileSize); //LARGE_INTEGER联合的指针,返回大小
这个函数接受一个LARGE_INTEGER联合的指针,用来返回文件大小,这个结构可以表示64位值:
typedef union _LARGE_INTEGER {
struct {
DWORD LowPart; // 低32位值
LONG HighPart; // 高32位值
};
LONGLONG QuadPart; // 64位值得
} LARGE_INTEGER, *PLARGE_INTEGER;
从这个定义可以看出,该联合可以用QuadPart表示一个64位值,也可以差分成两个32位值。这个联合有一个无符号数版本,叫做ULAGER_INTEGER联合,对应的3个成员都是保存的无符号数。
还有一个函数可以得到一个文件的大小:
DWORD GetCompressedFileSize(
PCTSTR pszFileName, //文件路径名
PDWORD pdwFileSizeHigh); //文件大小如果大于4GB,高32位值由该参数返回
这个函数接受一个文件的路径名称,返回文件大小的低32位值,高32位值由参数pdwFileSizeHigh返回。与GetFileSizeEx不同的是,该函数返回一个文件的物理大小,而GetFileSizeEx返回文件的逻辑大小。
比如一个文件大小为100KB,它被压缩为85KB,如果使用GetFileSizeEx,则返回100KB,使用GetCompressedFileSize则返回85KB。
与GetFileSizeEx不同的是,该函数接受一个字符串,指明文件路径,这就可以直接查询某个文件大小,而不要先打开它获得它的句柄。
可以如下使用该函数:
ULARGE_INTEGER ulFileSize; //与LARGE_INTEGER联合类似,保存无符号数
ulFileSize.LowPart = GetCompressedFileSize(TEXT("SomeFile.dat"),
&ulFileSize.HighPart); //取得当前目录下的SomeFile.dat文件大小
这样,64位的文件大小存储在ulFileSize.QuadPart中。
讨论完了文件的大小,下面来讨论文件读写指针。
CreateFile函数创建或打开了一个文件内核对象,该内核对象中管理着一个“文件读写指针”。该指针指明了一个64位的偏移量。初始情况下,该指针设置为0,即你读取或写入数据的时候从文件开始处进行,即从偏移量为0的地方开始。每次读取或写入N字节的数据,系统更新该读写指针,使偏移量加上N个字节。比如下面代码反映了读取文件前100个字节的数据:
BYTE pbFirst[50], pbSecond[50];
DWORD dwNumBytes;
HANDLE hFile = CreateFile(TEXT("MyFile.dat"), ...); //指针初始化为0
ReadFile(hFile, pbFirst, 50, &dwNumBytes, NULL); //读取第0~49字节
ReadFile(hFile, pbSecond, 50, &dwNumBytes, NULL);//读取第50~99字节
需要注意的是,一个文件对象句柄对应一个读写指针,如果一个文件被打开多次,那么就有多个文件对象,每个文件对象管理着一个读写指针,这些指针相互之间不影响。比如下面的代码:
BYTE pb[10];
DWORD dwNumBytes;
HANDLE hFile1 = CreateFile(TEXT("MyFile.dat"), ...); //指针初始化为0
HANDLE hFile2 = CreateFile(TEXT("MyFile.dat"), ...); //指针初始化为0
ReadFile(hFile1, pb, 10, &dwNumBytes, NULL); //读取第0~9字节
ReadFile(hFile2, pb, 10, &dwNumBytes, NULL); //也是读取第0~9字节
上面这段代码,hFile1和hFile2是同一个文件的两个不同的文件内核对象的句柄,这两个内核对象管理着两个不同文件指针,所以改变其中一个的读写指针,不会影响另一个。
下面这段代码更能说明问题:
BYTE pb[10];
DWORD dwNumBytes;
HANDLE hFile1 = CreateFile(TEXT("MyFile.dat"), ...); //读写指针初始化为0
HANDLE hFile2; //另一个文件句柄
//将本进程内hFile1句柄值复制给本进程中的hFile2
DuplicateHandle(
GetCurrentProcess(), hFile1,
GetCurrentProcess(), &hFile2,
0, FALSE, DUPLICATE_SAME_ACCESS);
ReadFile(hFile1, pb, 10, &dwNumBytes, NULL); //读取第0~9字节
ReadFile(hFile2, pb, 10, &dwNumBytes, NULL); //读取第10~19字节
上面这段代码,使用DuplicateHandle函数复制句柄,使得两个句柄hFile1和hFile2共用同一个文件内核对象,因此读写指针也是共用的。
可以使用SetFilePointerEx函数来定位文件读写指针:
BOOL SetFilePointerEx(
HANDLE hFile, //文件内核对象句柄
LARGE_INTEGER liDistanceToMove, //64位数,移动字节数
PLARGE_INTEGER pliNewFilePointer, //返回新的文件读写指针位置
DWORD dwMoveMethod); //移动方式
该函数中dwMoveMethod告诉系统如何移动。FILE_BEGIN,表示从文件头开始移动;FILE_END,表示从文件尾往前移动;FILE_CURRENT,表示从当前读写指针位置移动。移动的位移量在第2个参数liDistaceToMove中。
有几点需要注意
- 将文件读写指针的位置设置为超过文件大小范围是合法的。这么做不会使得文件大小变大,除非调用函数SetEndOfFile。
- 当打开文件使用函数CreateFile时,该函数的dwFlagsAndAttributes参数中包括FILE_FLAG_NO_BUFFERING,文件读写指针只能被设置为硬盘扇区的单位大小。
- 没有GetFilePointerEx函数来取得当前文件指针位置,可以调用SetFilePointerEx函数来得到其位置,要把第二个参数设置为0,如下代码:
LARGE_INTEGER liCurrentPosition = { 0 };
SetFilePointerEx(hFile, liCurrentPosition,
&liCurrentPosition,FILE_CURRENT);
当文件被关闭的时候,系统会在文件上设置一个结束位置,以确定该文件的大小。当然,你也可以自己设置文件的结束位置,以此来改变文件的大小。使用SetEndOfFile函数:
BOOL SetEndOfFile(HANDLE hFile);
该文件在当前的文件读写指针处设置文件的结束标志,来截断或扩展文件的大小。比如,你想设置一个文件的大小为1024字节的话,可以通过以下代码实现:
HANDLE hFile = CreateFile(...);
LARGE_INTEGER liDistanceToMove;
liDistanceToMove.QuadPart = 1024;
//设置文件指针
SetFilePointerEx(hFile, liDistanceToMove, NULL, FILE_BEGIN);
SetEndOfFile(hFile); //在文件指针处设置结束标志
CloseHandle(hFile);
前面曾经讲过,设备I/O的方式有两种:同步和异步。本篇介绍一下同步设备I/O。主要涉及到两个函数:ReadFile和WriteFile。
不要被这两个函数的名称迷惑,不仅可以将这两个作用于文件,也可以作用于其他设备:比如管道、邮槽等。
最简单的设备I/O,可以通过ReadFile和WriteFile这两个函数来实现:
BOOL ReadFile(
HANDLE hFile, //设备对象句柄
PVOID pvBuffer, //读取缓冲区
DWORD nNumBytesToRead, //读取的字节数
PDWORD pdwNumBytes, //返回实际读取的字节数
OVERLAPPED* pOverlapped); //重叠结构指针,仅在异步方式有用
BOOL WriteFile(
HANDLE hFile,
CONST VOID *pvBuffer,
DWORD nNumBytesToWrite,
PDWORD pdwNumBytes, //返回实际写入的字节数
OVERLAPPED* pOverlapped);
在同步方式下使用这2个函数进行设备I/O,在同步模式下,两个函数的最后一个参数pOverlapped都要设置为NULL。另外,必须要注意这一点:就是在用CreateFile创建或打开设备之时,其FLAG参数不能包括FLAG_FILE_OVERLAPPED,否则系统认为你想要异步地实现设备I/O。
另外,ReadFile只能读取这些设备,即在使用CreateFile创建或打开设备的时候,该函数的FLAG参数中包括GENERIC_READ。而WriteFile只能写入这些设备,即使用CreateFile函数的时候,FLAG参数包括GENERIC_WRITE。
邮槽、管道、文件、串行端口等设备是有自己的高速缓存的。如果在CreateFile函数的FLAG参数中没有包括FILE_FLAG_NO_BUFFERING,也就是可以将写入的数据暂存在缓冲区中,那么可以通过FlushFileBuffers来强行将暂存在与设备有关的缓冲区中的全部数据写入到设备中。
BOOL FlushFileBuffers(HANDLE hFile);
同步方式的设备I/O实现简单,但是缺点也是明显的,就是会阻碍有关线程中的其他与设备I/O无关的操作。因为设备I/O函数直到设备I/O请求结束才返回,如果数据量大,很可能会阻碍其他无关的操作。
为了解决这个问题,你应该尽量使用异步的设备I/O。但是可惜的是,Windows API中,没有为CreaetFile这个函数提供任何异步的方式来实现。Windows Vista提供了另一种方法:中途取消同步设备I/O。可以通过使用函数CancelSynchronousIo来取消一个线程之内的正在进行的同步设备I/O操作。
BOOL CancelSynchronousIo(HANDLE hThread); //参数是线程句柄
该函数接受一个线程句柄,该句柄是一个正在等待同步设备I/O操作完成的线程的句柄。该句柄在创建或打开的时候,必须具有THREAD_TERMINATE操作权限。如果你调用CreateThread或_beginthreadex函数来创建线程,那么返回的线程句柄就包含THREAD_TERMINATED的操作权限。如果使用OpenThread函数来获得一个已创建的线程的句柄,那么就传递THREAD_TERMINATED给dwDesiredAccess参数(第1个参数)。如果没有设置该权限,那么CancelSynchronousIo返回FALSE,调用GetLastError返回ERROR_ACCESS_DENIED(访问拒绝错误)。
如果线程已经结束了等待设备I/O,那么再调用CancelSynchronousIo函数会返回TRUE,而不是FLASE,调用GetLastError则返回ERROR_OPERATION_ABORTED(操作失败错误)。
如果线程并不是等待在设备I/O的返回上,那么调用该函数会返回FALSE,随后调用GetLastError会返回ERROR_NO_FOUND(未找到的错误)。
异步设备I/O适用于大数据量和高性能的场合,比如服务器。
要使用异步设备I/O,在调用CreateFile来打开或创建一个设备的时候,让参数dwFlagsAndAttributes包括FILE_FALG_OVERLAPPED,这意味着想让打开的设备可以被异步访问。
为了发送一个I/O请求给一个设备,也就是让一个I/O请求进入I/O队列,你可以使用ReadFile和WriteFile这两个函数:
BOOL ReadFile(
HANDLE hFile,
PVOID pvBuffer,
DWORD nNumBytesToRead,
PDWORD pdwNumBytes,
OVERLAPPED* pOverlapped);
BOOL WriteFile(
HANDLE hFile,
CONST VOID *pvBuffer,
DWORD nNumBytesToWrite,
PDWORD pdwNumBytes,
OVERLAPPED* pOverlapped);
当这两个函数被呼叫,系统通过第一个参数hFile,来查看该句柄指明的设备在打开的时候是否使用了FILE_FLAG_OVERLAPPED,如果使用了,这两个函数执行异步设备I/O,反之,则执行同步设备I/O。当使用异步I/O方式的时候,在调用这两个函数的时候,可以将NULL传递给pdwNumBytes参数,因为不知道何时设备I/O完成,因此使用这个参数没有多大意义。
注意最后一个参数,是一个OVERLAPPED结构的指针:
typedef struct _OVERLAPPED {
DWORD Internal; // 错误代码(出口参数,返回)
DWORD InternalHigh; // 传输的数据大小,以字节为单位(出口参数,返回)
DWORD Offset; // 低32位偏移量(入口参数,输入)
DWORD OffsetHigh; // 高32位偏移量(入口参数,输入)
HANDLE hEvent; // 事件内核对象句柄(入口参数,输入)
} OVERLAPPED, *LPOVERLAPPED;
该结构包含5个成员,其中的3个——Offset、OffsetHigh、hEvent应该在调用ReadFile和WriteFile之前被初始化,另外的2个——Internal、InternalHigh会在I/O完成的时候被设备驱动程序所设置,下面细述一下:
- Offset、OffsetHigh —— 在使用异步设备I/O来操纵“文件设备”的时候,文件读写指针被忽略,此时I/O的偏移量由OVERLAPPED结构中的Offset和OffsetHigh决定。另外,在“非文件设备”中,这两个成员不会被忽略,一般必须要设置为0。
- hEvent —— 一个事件内核对象句柄,可以有多种使用方法,后面会讲到。
- Internal —— 保存I/O错误码,当你发送一个I/O请求的时候,该参数被设置为STATUS_PENDING,指明没有错误发生,因为操作还没有开始。你可以使用HasOverlappedIoCompleted宏来查看一个异步设备I/O是否完成,该结构接受一个OVERLAPPED结构指针,如果I/O请求完成返回TRUE。如果I/O请求仍然没有开始,返回FALSE。
- InternalHigh —— 异步I/O请求完成的时候,该成员里保存了传送数据量的字节数。
当异步I/O请求完成之后,你可以接受到一个OVERLAPPED结构的指针。一般可以让一个C++类从OVERLAPPED结构派生,类中加入一些其他信息,使得更容易处理。然后当使用ReadFile和WriteFile函数的时候,可以传递这个C++类对象的指针,当I/O完成之后,接受该结构的时候,可以将其转换为C++类对象,不但可以获得其5个成员,还可以获得类中的其他信息。
使用异步设备I/O的时候,要注意以下三点:
1、设备驱动程序不一定会按照一个“先进先出”(FIFO)的顺序来处理设备I/O请求,因此如下编码不会保证先读后写:
OVERLAPPED o1 = { 0 };
OVERLAPPED o2 = { 0 };
BYTE bBuffer[100];
ReadFile (hFile, bBuffer, 100, NULL, &o1); //读
WriteFile(hFile, bBuffer, 100, NULL, &o2); //写
2、以异步的方式进行I/O请求的是,驱动程序可能会选择同步的方式。当你读取一个文件的时候,如果系统发现读取的数据在cache中,且数据有效,那么该I/O请求就不需要驱动程序了,而是直接将cache中的数据复制到你的缓冲区中。驱动在某些操作上一直使用同步方式,比如在NTFS格式上的文件压缩,扩展文件长度,添加文件信息等。
这个时候,如果ReadFile和WriteFile返回非0值,则表明它以同步方式进行。如果返回FLASE,说明发生了一个错误,这个时候可以通过GetLastError来取得信息,如果返回ERROR_IO_PENDING,则说明I/O请求成功提交,但没有完成。
3、数据缓冲区和OVERLAPPED结构在异步I/O请求完成之前不能被移动或释放。当设备驱动准备处理你的I/O请求的时候,它将数据传送到pvBuffer参数对应的地址上去,并访问OVERLAPPED结构中的Offset等成员。当I/O请求完成之后,设备驱动更新OVERLAPPED结果中的Internal和InternalHigh成员。因此,不能在I/O请求完成之前移动或释放数据缓冲区和OVERLAPPED结构,否则,内存数据会被破坏,而且在每次调用ReadFile或WriteFile的时候,都必须分配一个单独的OVERLAPPED结构。
比如,下面的代码是有BUG的:
VOID ReadData(HANDLE hFile)
{
OVERLAPPED o = { 0 };
BYTE b[100];
ReadFile(hFile, b, 100, NULL, &o);
} //此时缓冲区b和OVERLAPPED结构o都被释放
你可以将一个设备I/O请求取消排队,即撤消该请求。可以有如下方法:
1、在一个线程中调用CancelIo函数,可以取消该线程发送给指定设备有关的所有I/O请求,除了指定的设备是“I/O完成端口”。
BOOL CancelIo(HANDLE hFile); //参数是设备对象句柄
2、取消与一个设备有关的所有I/O请求,关闭这个设备句柄即可。
3、当一个线程结束,系统自动取消该线程发送的所有I/O请求,除了发送给“I/O完成端口的”I/O请求。
4、如果想取消某一个特定的I/O请求,可以使用CancelIoEx函数,传递一个OVERLAPPED结构指针给它:
BOOL CancelIoEx(HANDLE hFile, LPOVERLAPPED pOverlapped);
该函数可以跨线程使用,也就是在T1线程内发送的I/O请求,可以在T2线程内通过该函数结束之。因为每个I/O请求都需要一个唯一的OVERLAPPED结构,所以该OVERLAPPED结构就标识了一个I/O请求。如果传递NULL给CancelIoEx函数的第2个参数,那么就会取消与hFile对应的设备的所有I/O请求。
取消一个I/O请求,该I/O请求会结束,同时错误码被设置为ERROR_OPERATION_ABORTED。
上一篇,讨论了如何发送I/O请求。在异步的设备I/O请求方式下,要考虑的问题就是当I/O请求完成之后,驱动程序如何通知你的应用程序。本篇主要讨论获得通知的方法。
Windows 提供了4种不同的技术方法来得到I/O完成的通知。
技术
|
概要
|
通知一个设备内核对象
|
当一个设备同时有多个I/O请求的时候,该方法不适用。
允许一个线程发送一个I/O请求,另一个线程处理之。
|
通知一个事件内核对象
|
允许一个设备同时有多个I/O请求。
允许一个线程发送一个I/O请求,另一个线程处理之。
|
告警I/O
|
允许一个设备同时有多个I/O请求。
必须在同一个线程中发送并处理同一个I/O请求。
|
I/O完成端口
|
允许一个设备同时有多个I/O请求。
允许一个线程发送一个I/O请求,另一个线程处理之。
该方法伸缩性好,而且性能高。
|
本篇主要讨论前3种。
通知一个设备内核对象
在Windows中,一个设备内核对象可以处于“已通知”或“未通知”状态。ReadFile和WriteFile在发送I/O请求之前让指定的设备内核对象处于“未通知”状态。当设备驱动程序完成了I/O请求,驱动程序将设备内核对象设置为“已通知”状态。
一个线程可以查看一个异步的I/O请求是否完成,通过等待函数即可实现:WaitForSingleObject或WaitForMultipleObject等。这就意味着,这种实现的方式不是完完全全的“异步”,最终有点“同步”的味道,因为这些等待函数可能会导致线程进入阻塞状态。
可以如下地编码来使用这种方法:
//创建或打开设备内核对象,注意使用FILE_FLAG_OVERLAPPED旗标
HANDLE hFile = CreateFile(..., FILE_FLAG_OVERLAPPED, ...);
BYTE bBuffer[100]; //I/O缓冲区
OVERLAPPED o = { 0 }; //重叠结构,不要忘记初始化
o.Offset = 345; //偏移量
BOOL bReadDone = ReadFile(hFile, bBuffer, 100, NULL, &o); //读取数据
DWORD dwError = GetLastError();
//ReadFile返回FLASE,但是错误码dwError表明I/O即将开始
if (!bReadDone && (dwError == ERROR_IO_PENDING))
{
//等待I/O请求完成
WaitForSingleObject(hFile, INFINITE);
bReadDone = TRUE;
}
if (bReadDone)
{
// 操作成功,可以查看OVERLAPPED结构中的各个字段和缓冲区中的数据
// o.Internal 包含了I/O错误码
// o.InternalHigh 包含了I/O传输字节数
// 缓冲区包含了读取的数据
}
else
{
// 错误发生,bReadDone为FLASE,且错误码dwError指明一个错误
}
这种方法是十分简单的,实现起来十分容易,但是有一个明显的缺点,就是无法处理多个I/O请求。因为一旦一个I/O请求完成,等待函数就会返回,无法识别是哪个I/O请求完成了。
通知一个事件内核对象
这种方法可以处理多个同时的I/O请求。
记得OVERLAPPED结构中有一个hEvent成员吧,该成员是一个事件内核对象。使用这种方法,你必须使用CreateEvent函数来创建一个事件内核对象,并初始化那个hEvent成员。当一个异步I/O请求完成设备驱动程序查看OVERLAPPED中的hEvent是否为NULL,如果不是,驱动程序通过SetEvent通知该事件内核对象,同时也使得设备内核对象进入“已通知”状态。但是,你应该等待在该事件内核对象上。
你可以让Windows不通知“文件内核对象”,这样可以少许提高一点性能,通过呼叫函数SetFileCompletionNotificationModes即可,传递一个设备内核对象句柄和FILE_SKIP_SET_EVENT_ON_HANDLE旗标:
BOOL SetFileCompletionNotificationModes(HANDLE hFile, UCHAR uFlags);
为了处理多个I/O请求,你必须为每个I/O请求创建一个独立的事件内核对象,并将之初始化OVERLAPPED结构中的hEvent。然后可以通过WaitForMultipleObject来等待这些事件内核对象。这种方法可以实现一个设备上的多个I/O请求的处理。可以如下编码:
//创建或打开设备,注意使用FILE_FLAG_OVERLAPPED
HANDLE hFile = CreateFile(..., FILE_FLAG_OVERLAPPED, ...);
BYTE bReadBuffer[10]; //读缓冲区
OVERLAPPED oRead = { 0 }; //定义OVERLAPPED结构,并初始化之
oRead.Offset = 0;
oRead.hEvent = CreateEvent(...); //创建事件内核对象,与读操作相关
ReadFile(hFile, bReadBuffer, 10, NULL, &oRead);
BYTE bWriteBuffer[10] = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 };
OVERLAPPED oWrite = { 0 };
oWrite.Offset = 10;
oWrite.hEvent = CreateEvent(...); //另一个事件内核对象,与写操作相关
WriteFile(hFile, bWriteBuffer, _countof(bWriteBuffer), NULL, &oWrite);
//可在此执行其他操作
//......
HANDLE h[2];
h[0] = oRead.hEvent; //与读相关的事件对象
h[1] = oWrite.hEvent; //与写相关的事件对象
DWORD dw = WaitForMultipleObjects(2, h, FALSE, INFINITE); //等待
switch (dw – WAIT_OBJECT_0)
{
case 0: //读操作完成
break;
case 1: //写操作完成
break;
}
当然,也可以把上面代码拆分成两个线程执行,上面半段为发送I/O请求的放在一个线程中,下面处理I/O请求完成的放在另一个线程中。
在I/O请求完成之后,收到通知之后,可以得到有关OVERLAPPED结构的信息,通过函数GetOverlappedResult:
BOOL GetOverlappedResult(
HANDLE hFile, //设备对象句柄
OVERLAPPED* pOverlapped, //OVERLAPPED结构指针,返回OVERLAPPED
PDWORD pdwNumBytes, //返回传输的字节数
BOOL bWait); //是否等到I/O结束才返回
告警I/O
当一个线程被创建的时候,系统也创建一个与该线程关联的队列,这个队列称为“异步过程调用”(APC)队列。当发送一个I/O请求的时候,你可以告诉驱动程序在APC队列中加入一个记录。当I/O请求完成之后,如果线程处于“待命状态”,则该记录中的回调函数可以被调用。
让I/O请求完成的通知进入线程的APC队列,即在APC队列中添加一个I/O请求完成通知的记录,可以使用如下两个函数:
BOOL ReadFileEx(
HANDLE hFile, //设备对象句柄
PVOID pvBuffer, //数据缓冲区
DWORD nNumBytesToRead, //预期传输的数据
OVERLAPPED* pOverlapped, //OVERLAPPED结构指针
LPOVERLAPPED_COMPLETION_ROUTINE pfnCompletionRoutine);//回调函数指针
BOOL WriteFileEx(
HANDLE hFile,
CONST VOID *pvBuffer,
DWORD nNumBytesToWrite,
OVERLAPPED* pOverlapped,
LPOVERLAPPED_COMPLETION_ROUTINE pfnCompletionRoutine);
注意一下函数的最后一个参数pfnCompletionRoutine,是一个函数指针,接受一个回调函数,这个函数就是被记录到APC队列的函数,函数头必须按如下格式书写:
VOID WINAPI CompletionRoutine( //函数名可以任意
DWORD dwError, //错误码
DWORD dwNumBytes, //传输的数据
OVERLAPPED* po); //OVERLAPPED结构
当使用ReadFileEx和WriteFileEx函数的时候,传递回调函数的地址,当驱动程序完成I/O请求之后,它在线程APC队列中添加一个记录,这个记录包含这个回调函数的地址和起初发送I/O请求时候的OVERLAPPED结构地址。
当线程进入“待命状态”,系统检测线程APC队列,然后调用回调函数,并设置其3个参数。
当I/O请求完成,系统不会马上调用记录在APC队列中的回调函数,因为线程可能没有进入“待命状态”。为了调用回调函数,你必须让线程进入“待命状态”,可以通过一些带“Ex”的等待函数来完成:
DWORD SleepEx(
DWORD dwMilliseconds,
BOOL bAlertable);
DWORD WaitForSingleObjectEx(
HANDLE hObject,
DWORD dwMilliseconds,
BOOL bAlertable);
DWORD WaitForMultipleObjectsEx(
DWORD cObjects,
CONST HANDLE* phObjects,
BOOL bWaitAll,
DWORD dwMilliseconds,
BOOL bAlertable);
BOOL SignalObjectAndWait(
HANDLE hObjectToSignal,
HANDLE hObjectToWaitOn,
DWORD dwMilliseconds,
BOOL bAlertable);
BOOL GetQueuedCompletionStatusEx(
HANDLE hCompPort,
LPOVERLAPPED_ENTRY pCompPortEntries,
ULONG ulCount,
PULONG pulNumEntriesRemoved,
DWORD dwMilliseconds,
BOOL bAlertable);
DWORD MsgWaitForMultipleObjectsEx(
DWORD nCount,
CONST HANDLE* pHandles,
DWORD dwMilliseconds,
DWORD dwWakeMask,
DWORD dwFlags); //使用MWMO_ALERTABLE使线程进入“待命状态”
除了MsgWaitForMultipleObjectEx函数之外,上面其余5个函数的最后一个参数bAlertalbe,指明了是否要线程进入“待命状态”,如果需要,请传递TRUE。
当你调用上面这些等待函数,并让线程进入“待命状态”,系统首先查看线程的APC队列,如果至少有一个记录在APC队列中,系统不会让你的线程进入阻塞状态,而是调用回调函数,并提供其3个参数。当回调函数返回给系统,系统再次检查APC队列中的记录,如果存在,继续调用回调函数。否则,回调函数返回给用户(即普通的返回)。
注意,如果APC队列中存在记录,那么调用上述等待函数,不会让你的线程进入阻塞状态。只有当APC队列中没有记录,调用这些函数的时候才会让线程进入阻塞状态,直到等待的内核对象为“已通知”状态或APC队列中出现记录。由于线程处于“待命状态”,因此一点APC队列中出现一个记录,那么系统唤醒你的线程,呼叫回调函数,清空APC队列,回调函数返回,线程继续执行。
这6个等待函数返回的值说明了它们是因为什么原因而返回的。如果返回WAIT_IO_COMPLETION,那么说明了你的线程继续执行,因为至少一个APC记录被处理。如果返回其他的值,那么说明这些等待函数等待的内核对象为“已通知”状态(也可能是互斥内核对象被抛弃)或者等待超时。
还有需要注意的是,系统调用APC回调函数,不是按FIFO的顺序,而是随意的。注意如下代码:
hFile = CreateFile(..., FILE_FLAG_OVERLAPPED, ...);
ReadFileEx(hFile, ..., ReadRoutine1); //第一次读,回调函数ReadRoutine1
WriteFileEx(hFile, ..., WriteRoutine1); //第一次写,回调函数WriteRoutine1
ReadFileEx(hFile, ..., ReadRoutine2); //第二次读,回调函数ReadRoutine2
SomeFunc(); //其他一些操作
SleepEx(INFINITE, TRUE); //等待,线程进入“待命状态”
线程发起了3次I/O请求,并给出了3个回调函数ReadRoutine1、WriteRoutine1、ReadRoutine2。然后线程执行SomeFunc函数,执行完成之后进入无限等待,当I/O请求结束,会调用3个APC队列中的回调函数。
需要注意的是,如果3个I/O请求都在SomeFunc函数执行的时候完成,那么回调函数的调用顺序可能不是ReadRountine1、WriteRoutine1、ReadRoutine2,这个顺序是任意的。
Windows提供了一个函数可以手动在一个线程的APC队列加入一个记录(即加入一个回调函数):
DWORD QueueUserAPC(
PAPCFUNC pfnAPC, //APC回调函数指针
HANDLE hThread, //线程对象句柄
ULONG_PTR dwData); //传递给参数pfnAPC所对应的回调函数的参数
其中第1个参数是一个函数指针,是一个回调函数,被记录到线程的APC队列,其函数头格式如下:
VOID WINAPI APCFunc(ULONG_PTR dwParam);
QueueUserAPC函数的第2个参数指明了你想要设置的哪个线程的APC队列。第3个参数dwData就是传递给回调函数APCFunc的参数。QueueUserAPC可以让你的线程摆脱阻塞状态,此时上述等待函数返回码为WAIT_IO_COMPLETION。
最后要讲的就是告警I/O的缺点:
- 告警I/O的回调函数所提供的参数较少,因此处理上下文内容只能通过全局变量来实现。
- 使用告警I/O,意味着发送I/O请求和处理I/O完成通知只能放在同一个线程中,如果发送多个I/O请求,该线程就不得不处理每个I/O完成通知,其他线程则会比较 空闲,这样会造成不平衡。
上一篇讲了3种接受异步I/O请求完成的通知的方法,分别是:通知一个设备内核对象、通知一个事件内核对象、告警I/O。
本篇主要讲另一种接受异步I/O请求的方法——I/O完成端口。这是性能最高,且扩充性最好的方法。但是实现比较复杂。
介绍I/O完成端口之前介绍两种服务器线程模型:
- 连续模型:单个线程等待一个客户的请求,一旦有一个客户发出请求,该线程唤醒然后处理客户的请求。
- 并发模型:单个线程等待一个客户的请求,一旦有一个客户发出请求,该线程创建另一个线程来处理请求。在新创建的线程处理请求的同时,原来等待请求的线程通过循环继续等待另一个客户的请求。当处理请求的线程处理完毕之后,自动销毁。
连续模型最大的缺点就是无法同时处理多个请求。它只能等待、处理、等待、处理……如此交替进行。当有2个请求同时到来时,只能处理其中之一,第2个请求必须等待直到第1个请求处理完毕。Ping服务器就是典型的连续模型。
并发模型,让一个线程专门地等待请求,该线程可以为每一个请求创建一个线程来处理之。其优点是等待请求的线程所做的工作很少,默认状态为阻塞状态。当一个客户请求到来的时候,该线程被唤醒,然后创建一个新的线程来处理这个请求,然后这个线程继续等待另一个请求。这样,当有多个客户请求同时到来的时候,它们可以几乎同时被处理。但是当客户请求过多,那么就会存在太多的处理线程,这些线程都是可以被调度的,那么就会出现很多次的“线程转换”,这样,Windows内核会花费大量的时间在“线程转换”这个工作上,从而浪费了大量的时间。Windows为了解决这个问题,提供了“I/O完成端口”内核对象。
不妨设想一下,如果事先创建了一些线程,让这些线程处于等待状态,然后将所有用户的请求都投递到一个消息队列中,然后这些线程被唤醒,逐一地从消息队列中取出请求并进行处理,就可以避免为每个用户开辟线程,节省资源,也提高了线程利用率。其实I/O完成端口就是基于这样思想的产物。感觉就是一个“消息队列”,与本身的名字“I/O完成端口”没有很大的联系。
创建I/O完成端口
I/O完成端口可以称为是最复杂的内核对象,可以使用CreateIoCompletionPort创建一个I/O完成端口内核对象:
HANDLE CreateIoCompletionPort(
HANDLE hFile, //设备句柄
HANDLE hExistingCompletionPort, //已经创建的I/O完成端口对象句柄
ULONG_PTR CompletionKey, //一个完成Key,相当于完成标号
DWORD dwNumberOfConcurrentThreads); //允许同时运行的线程个数
乍看一下这个函数,很难理解。其实,这个函数有两个功能:创建I/O完成端口,将一个I/O完成端口与一个设备关联起来。因此,可以将该函数拆开。下面的函数CreateNewCompletionPort用来创建一个I/O完成端口:
HANDLE CreateNewCompletionPort(DWORD dwNumberOfConcurrentThreads)
{
return(CreateIoCompletionPort(INVALID_HANDLE_VALUE, NULL, 0,
dwNumberOfConcurrentThreads));
}
这个函数接受一个参数,并在内部调用CreateIoCompletionPort,将其前3个参数设置为INVALID_HANDLE_VLAUE,NULL,0。并保留最后一个参数给用户,如此便创建了一个I/O完成端口,参数dwNumberOfConcurrentThreads告诉I/O完成端口当前允许有多少个线程可以执行,如果传递0,则表示允许执行的线程个数没有限制。这个参数就是为了防止“线程切换”过于频繁。你可以动态地增加它的值,这样来测试一个合理的可运行线程数,以达到性能最佳。
关联I/O完成端口与设备
当你创建了一个I/O完成端口,内核实际上创建了5个数据结构:
1、设备列表:与创建的I/O完成端口关联的设备
2、I/O请求完成队列(FIFO):
3、等待线程队列(LIFO)
4、释放线程列表
5、暂停线程列表
第1个数据结构:设备列表指明了与这个I/O完成端口关联的设备,可以是一个设备,也可以是多个设备。你可以通过CreateIoCompletionPort函数关联设备和I/O完成端口,也可以将该函数拆开,使用如下函数:
BOOL AssociateDeviceWithCompletionPort(
HANDLE hCompletionPort, // I/O完成端口内核对象句柄
HANDLE hDevice, // 设备内核对象句柄
DWORD dwCompletionKey) // 完成Key
{
HANDLE h = CreateIoCompletionPort(hDevice, hCompletionPort,
dwCompletionKey, 0);
return (h == hCompletionPort);
}
这个函数提供了一个I/O完成端口句柄和一个设备句柄,并将两者关联起来。其中最后一个参数,是一个完成Key,在处理I/O请求完成的通知的时候,这个值才有用,它只是对你有意义,系统不会注意它。
每次调用这个,系统在I/O完成端口的“设备列表”这个数据结构中添加了一个记录,这个记录指明了与这个I/O完成端口相关联的设备。
由于CreateIoCompletionPort函数比较复杂,因此建议将其拆开使用,或者也可以同时创建I/O完成端口并关联设备,如下编码:
#define CK_FILE 1
HANDLE hFile = Create(...);
// 创建I/O完成端口并将hFile最代表的设备关联起来,允许可运行线程数为2
HANDLE hCompletionPort = CreateCompletionPort(hFile, NULL, CK_FILE, 2);
第2个数据结构是“I/O请求完成队列”。当一个异步设备I/O请求完成,系统查看该设备是否与一个I/O完成端口关联,如果是,系统在“I/O请求完成队列”的队尾加上一个“已经完成的I/O请求”的记录。队列中的每个记录指明以下内容:1、传输的数据的字节数;2、设备与I/O完成端口关联时候的完成Key;3、I/O请求的OVERLAPPED结构指针;4、一个错误码。
取得I/O完成端口状态信息
当你的服务器系统启动,应该创建一个I/O完成端口,然后创建一个线程池来处理客户请求,一般而言,线程池中线程的数量为CPU的2倍。
线程池中的所有线程所执行的功能是一样的,这些线程往往进入阻塞状态来等待设备I/O完成,可以通过GetQueuedCompletionStatus函数实现:
BOOL GetQueuedCompletionStatus(
HANDLE hCompletionPort, // I/O完成端口对象句柄
PDWORD pdwNumberOfBytesTransferred, //传输数据的字节数
PULONG_PTR pCompletionKey, //关联的完成Key
OVERLAPPED** ppOverlapped, //OVERLAPPED结构的指针的地址
DWORD dwMilliseconds); //等待时间(毫秒)
这个函数让线程等待一个特定的I/O完成端口,通过第一个参数指明这个I/O完成端口。这个函数使得呼叫它的线程进入等待状态,直到在这个I/O完成端口的“I/O请求完成队列”中出现了一个记录,或者参数dwMilliseconds指明的时间超出。
第3个数据结构:“等待线程队列”,指明了所有等待在这个I/O完成端口上的线程,这些线程都是因为呼叫GetQueuedCompletionStatus函数而等待一个I/O完成端口的,这些线程的ID记录在这个队列中,使得I/O完成端口可以知道哪些线程正在等待。当一个与I/O完成端口关联的设备完成了一个异步设备I/O请求的时候,“I/O请求完成队列”的队尾会出现一个记录,此时I/O完成端口唤醒在“等待线程队列”中的一个线程,这个线程呼叫的GetQueuedCompletionStatus函数会返回,并得到传输数据的字节数、完成Key、OVERLAPPED结构的地址。
确定GetQueuedCompletionStatus函数返回的原因比较复杂,可以通过下面编码确定之:
DWORD dwNumBytes; //传输数据的字节数
ULONG_PTR CompletionKey; //完成Key
OVERLAPPED* pOverlapped; //OVERLAPPED结构指针
// hIOCP是一个I/O完成端口对象句柄,在其他地方被创建
BOOL bOk = GetQueuedCompletionStatus(hIOCP,
&dwNumBytes, &CompletionKey, &pOverlapped, 1000);
DWORD dwError = GetLastError(); //取得错误码
if (bOk)
{
// 等待成功,一个I/O请求完成了,可以处理之
}
else
{
if (pOverlapped != NULL)
{
// I/O请求失败,dwError错误码包含了错误的原因
}
else
{
if (dwError == WAIT_TIMEOUT)
{
// 等待时间超出,没有记录出现在“I/O请求完成队列”
}
else
{
// 错误地呼叫GetQueuedCompletionStatus,比如句柄无效
// dwError错误码中包含错误的原因
}
}
}
要注意的是,“I/O请求完成队列”中的记录是按FIFO的方式入队和出队的。而“等待线程队列”中的线程是按LIFO的方式进出的,很像堆栈(但是作者就说是queue)。
在Windows Vista中,如果你希望很多I/O请求被同时提交或处理,你不需要增加很多线程,而可以通过GetQueuedCompletionStatusEx来取得多个I/O请求完成的结果:
BOOL GetQueuedCompletionStatusEx(
HANDLE hCompletionPort, //I/O完成端口句柄
LPOVERLAPPED_ENTRY pCompletionPortEntries, //I/O请求完成记录数组
ULONG ulCount, //I/O请求完成记录的个数
PULONG pulNumEntriesRemoved, //实际取得的I/O请求完成记录
DWORD dwMilliseconds, //等待时间
BOOL bAlertable); //是否让线程进入“待命状态”,一般设置为FALSE
该函数的第2个参数是一个指向结构OVERLAPPED_ENTRY的地址(一般是一个该结构的数组),该结构定义如下:
typedef struct _OVERLAPPED_ENTRY {
ULONG_PTR lpCompletionKey; //完成Key
LPOVERLAPPED lpOverlapped; //OVERLAPPED指针
ULONG_PTR Internal; //该字段应该避免使用
DWORD dwNumberOfBytesTransferred; //传输数据的字节数
} OVERLAPPED_ENTRY, *LPOVERLAPPED_ENTRY;
本书中有一节“How the I/O Completion Port Manages the Thread Pool
”,感觉没有必要说了,看看就行,都是内部细节。
还有要讲的就是线程池中应该有多少个线程。看过一些资料,本书上说是CPU个数的2倍,还有一些资料上说是2*CPU个数+2,这个感觉也没有什么好讲的,具体问题具体分析吧,呵呵。
模仿完成的I/O请求
你可以模仿一个完成的I/O请求,让某个等待在I/O完成端口上的线程唤醒并执行。这也是一种线程间通信的机制。你可以通过PostQueuedCompletionStatus实现之:
BOOL PostQueuedCompletionStatus(
HANDLE hCompletionPort, // I/O完成对象句柄
DWORD dwNumBytes, // 预期传递数据的字节数
ULONG_PTR CompletionKey, // 完成Key
OVERLAPPED* pOverlapped); // OVERLAPPED结构指针
该函数在I/O完成端口的“I/O请求完成队列”中加入一个记录,这个记录对应的一些数据由该函数的第2、3、4个参数给出。调用成功,该函数返回TRUE。
I/O完成端口使用步骤
我以网络服务的套接字为例,说明一下I/O完成端口的使用步骤:
1、初始化套接字(Ws2_32.dll)——WSAStartup
2、创建一个I/O完成端口
3、创建一些线程,可以包含一个监听线程和若干个等待状态的处理线程
4、创建一个套接字socket,并邦定(bind),然后监听(listen)
5、反复循环,调用accept等待客户请求连接,
6、将连接进来的套接字与I/O完成端口关联起来
7、投递一个处理信息的请求,可以使用PostQueuedCompletionStatus,唤醒处理线程,从而让处理线程进行连接请求处理。
如此重复5~7即可。