• 核心编程笔记9——内核对象的线程同步2


    “信号量内核对象”用于对资源进行计数。

      在信号量内核对象内部,和其他内核对象一样,有一个使用计数,该使用计数表示信号量内核对象被打开的次数。

      信号量内核对象中还有两个比较重要的数据,分别表示最大资源数和当前资源数。最大资源数表示能够管理的资源的总数,当前资源数表示目前可以被使用的资源数量。

      可以使用CreateSeamphore函数来创建一个信号量内核对象,该函数成功返回句柄,失败返回NULL。

    HANDLE CreateSemaphore(
       PSECURITY_ATTRIBUTE psa,     
    //安全属性结构指针
       LONG lInitialCount,          //初始可用资源数
       LONG lMaximumCount,          //最大资源数
       PCTSTR pszName);             //信号量内核对象的名字(NULL表示匿名)

      在Windows Vista中,提供了一个新的创建信号量内核对象的函数CreateSemaphoreEx,该函数成功返回句柄,失败返回NULL。

    HANDLE CreateSemaphoreEx(
       PSECURITY_ATTRIBUTES psa,     
    //安全属性结构指针
       LONG lInitialCount,           //初始可用资源数
       LONG lMaximumCount,      //最大资源数
       PCTSTR pszName,          //信号量内核对象的名字(NULL表示匿名)
       DWORD dwFlags,               //保留型参数,应设置为0
       DWORD dwDesiredAccess);      //访问限制(参看MSDN)

      同样,可以打开一个指定名称的信号量,使用OpenSemaphore函数:

    HANDLE OpenSemaphore(
       DWORD dwDesiredAccess,     
    //访问限制(参看MSDN)
       BOOL bInheritHandle,       //是否允许返回的句柄子进程被继承
       PCTSTR pszName);           //指定的信号量名称

      假如,作为一个服务器,有一个缓冲区需要用来存放客户的连接请求,还有一个线程池用来处理连接。但是该缓冲区和线程池的大小有限,比如至多只能同时接纳和处理10位客户的连接请求,而当有10位客户请求连接而尚未处理完成的时候,此时一个新客户也试图建立连接,那么这个连接过程应该被推后,直到有一个连接处理完成之后,这个新客户的连接才能被处理。

      这个时候,可以使用信号量机制来处理线程同步的问题。

      当服务器初始化的时候,最大资源数为10,没有任何服务器请求连接,可以使用如下代码创建信号量内核对象:

    HANDLE hSem = CreateSemaphore(NULL, 010, NULL);

      该函数创建了一个信号量内核对象,最大资源数为10,当前可用资源数为0。由于当前可用资源数为0,所以调用WaitForSingleObject等这些等待函数来等待该信号量句柄的线程都会进入等待状态。

      这些等待函数在内部会查看信号量内核对象的可用资源数,如果该值大于0,则将其减1,线程保持可调度状态,这些比较和设置可用资源数是以原子过程进行的,所以是线程安全的。

      如果可用资源数等于0,则线程进入等待状态,当一个线程将信号量的可用资源数递增之后,某个或某些等待的线程就可以进入就绪状态。

      可以调用ReleaseSemaphore函数来让信号量内核对象的可用资源数递增:

    BOOL ReleaseSemaphore(
       HANDLE hSemaphore,     
    //信号量内核对象句柄
       LONG lReleaseCount,       //可用资源增加个数
       PLONG plPreviousCount);    //返回上次可用资源的数量,一般传递NULL忽略之

      可惜的是,Windows没有提供一种方法让我们仅仅是查询当前信号量的可用资源数。

      自己总结了一下信号量使用的模型:

    HANDLE g_hSem;     //信号量句柄,在其他线程(比如主线程)中创建
    DWORD WINAPI ThreadProc(PVOID pvParam)     //线程函数
    {
         
    //等待信号量,如果可用资源大于0,递减资源,线程继续运行,否则线程等待
         WaitForSingleObject(g_hSem, INFINITE);

         
    //访问资源

         
    //访问完毕,释放,递增可用资源数1个(可以根据需要递增n个)
         ReleaseSemaphore(g_hSem, 1, NULL);
    }
    互斥内核对象确保一个线程独占地访问资源。

      互斥内核对象的行为特征和关键代码段有点类似,但是它是属于内核对象,而关键代码段是用户模式对象,这导致了互斥内核对象的运行速度比关键代码段要低。所以,在考虑线程同步问题的时候,首先考虑用户模式的对象。

      但是,互斥内核对象可以跨进程使用,当需要实现多进程之间的线程同步,就可用考虑使用互斥内核对象。而这点,关键代码段无能为力。

     

      在互斥内核对象内部,有以下一些重要的数据:

    1、使用计数:表明该互斥内核对象被打开的次数。

    2、线程ID

    3、递归计数器

      线程ID表明了该互斥内核对象被哪个线程所拥有,递归计数器表明了这个线程(拥有互斥对象)拥有这个互斥对象的次数。

     

      互斥对象的使用规则如下

    • 如果内部线程ID为0(或者是一个无效的线程ID),该互斥内核对象不被任何线程所拥有,会发出通知信号,即处于“已通知”状态。
    • 如果线程ID不为0,而是一个有效的线程ID,那么该互斥内核对象就被这个线程所拥有,而且该互斥内核对象为“未通知”状态。
    • 与其他内核对象不同的是,互斥内核对象在操作系统中有着特殊的代码,允许以不正常的规则进行使用。

    设备的输入输出,即设备I/O,可以分为“同步”和“异步”两种方式。同步的设备I/O,调用的API函数总是等到设备I/O完成才返回。而异步的设备I/O,可以通过多种方法来实现,但是其根本原理是得到“设备I/O的完成通知”。

      本篇主要讨论如何打开和关闭一个设备。注意,这里的设备,不是指像键盘、显示器那种实体。而是一种抽象的概念,指一种与外界通信的对象,可以接受外界的输入,也可以对外界的请求作出响应,称之为设备I/O。这个概念比较抽象,这些设备往往和某个内核对象关联。要打开这些设备,就要创建相关的内核对象。

      这些设备包括文件、目录、逻辑磁盘驱动、物理磁盘驱动、串行端口、并行端口、邮槽、管道、套接字、控制台(如下表):

    设备

    主要用途 

    文件

    保存数据

    目录

    属性和文件压缩设置

    逻辑磁盘驱动

    磁盘格式化

    物理磁盘驱动

    访问分区表

    串行端口

    串行传输数据

    并行端口

    多位数据同时传输,主要是将数据传输给打印机

    邮槽

    一对多传输数据,往往适用于一个网络中的一台计算机向其他机器发送数据

    命名管道

    一对一传输数据,往往适用于一个网络中的一台计算机向其他机器发送数据

    匿名管道

    一对一传输数据,适用于简单的数据传输,不适用于网络

    套接字

    以流或数据报的形式发送数据,适用于一个网络中的通信

    控制台

    一个文字窗口显示缓冲区

      要使用这些设备,你首先应该打开这些设备。

      Windows努力隐藏这些设备的差异,所以,很多设备的打开的I/O工作可以通过同一个API函数完成,如下表:

    设备

    经常用来打开设备的API函数和用法

    文件

    CreateFile —— 打开设备的函数。

    将参数pszName是一个文件路径名。

    目录

    CreateFile —— 打开设备的函数。

    将参数pszName是一个目录名。Windows允许你打开一个目录,通过使用参数FILE_ FLAG_BACKUP_SEMANTICS旗标来呼叫CreateFile函数。打开目录之后,就可以这是目录属性,即文件夹属性,比如正常、隐藏、系统、只读等。

    逻辑磁盘驱动

    CreateFile —— 打开设备的函数。

    将参数pszName设置为字符串“\\.\x:”。 比如要打开C盘,就将其设置为“\\.\C:”。

    物理磁盘驱动

    CreateFile —— 打开设备的函数。

    将参数pszName设置为“\\.\PHYSICALDRIVEx”。比如打开第一个物理硬盘扇区:可以这么调用CreateFile函数:

    CreateFile(TEXT("\\.\PHYSICALDRIVE0"), ...);

    这样就可以打开一个物理磁盘驱动,并且可以直接访问硬盘分区表。

    但是打开物理磁盘驱动是存在潜在危险的,特别是当错误的写入,会造成物理磁盘内容的破坏。

    串行端口

    CreateFile —— 打开设备的函数。

    将参数pszName设置为“COMx”,比如打开COM1串口设备,只要将其设置为“COM1”。

    并行端口

    CreateFile —— 打开设备的函数。

    将参数pszName设置为“LPTx”,比如打开LPT1并行端口,将其设置为“LPT1”。

    邮槽(服务器端)

    CreateMailslot —— 打开设备的函数。

    将参数pszName设置为“\\.\mailslot\mailslotname”,其中,“mailsoltname”是为邮槽取的名字,可以任意,前面的字符串是固定的。

    邮槽(客户端)

    CreateFile —— 打开设备的函数。

    将参数pszName设置为“\\servername\mailslot\mailslotname”,其中,“mailsoltname”是为邮槽取的名字,可以任意,前面的字符串是固定的。

    命名管道

    (服务器端)

    CreateFile —— 打开设备的函数。

    将参数pszName设置为“\\.\pipe\pipename”,其中,“pipename”是为命名管道取的名字,可以任意,前面的字符串是固定的。

    命名管道

    (客户端)

    CreateFile —— 打开设备的函数。

    将参数pszName设置为“\\servername\pipe\pipename”,其中,“pipename”是为命名管道取的名字,可以任意,前面的字符串是固定的。

    匿名管道

    CreatePipe —— 打开设备的函数。

    无论是客户端还是服务器端都以该函数创建或打开匿名管道。

    套接字

    socket —— 创建一个套接字描述符accept, or AcceptEx.

    控制台

    Console

    CreateConsoleScreenBuffer,GetStdHandle —— 打开设备的函数

      从上表可以发现,很多设备都以CreateFile函数来创建和打开。这个函数以后会讲。

      打开了设备,你得到了一个设备的句柄,你就可以通过该句柄使用其他函数,来对相关设备进行设置。

      比如,现在打开了一个串行端口,然后要设置它的传输波特率:

    BOOL SetCommConfig(
       HANDLE       hCommDev,
       LPCOMMCONFIG pCC,
       DWORD        dwSize);

      或者,你获得了一个邮槽句柄,可以设置读取数据的等待时间:

    BOOL SetMailslotInfo(
       HANDLE hMailslot,
       DWORD  dwReadTimeout);

      最后,不要忘记关闭句柄,从而正确地关闭设备:

    BOOL CloseHandle(HANDLE hObject);
    int closesocket(SOCKET s);   //套接字的关闭

      如果你有了一个设备句柄,你可以调查它的设备类型,通过使用GetFileType函数,该函数的返回值表明了它是一个什么类型的设备,可以参考MSDN。

    DWORD GetFileType(HANDLE hDevice);

      好了,现在让我们来讨论一下CreateFile函数:

    HANDLE CreateFile(
       PCTSTR pszName,     
    //指明设备类型或一个特定的设备实体
       DWORD dwDesiredAccess,     //访问限制
       DWORD dwShareMode,         //共享方式
       PSECURITY_ATTRIBUTES psa,     //安全描述结构
       DWORD dwCreationDisposition,  //创建和打开方式
       DWORD dwFlagsAndAttributes,   //属性旗标,与缓冲区和文件操作属性有关
       HANDLE hFileTemplate);        //设备模版,一个设备句柄

      该函数成功,返回句柄,失败返回INVALID_HANDLE_VALUE(值为-1)。

      如果设置了最后一个参数hFileTemplate,那么就照着这个参数所代表的设备,创建一个属性相同的设备,当然,这个参数所表示的设备要具有“可读”的权限,即有GENERIC_READ访问权限。

      至于该函数的具体用法,可以参看本书或MSDN。

      要使用互斥内核对象,首先必须创建它:

    HANDLE CreateMutex(
       PSECURITY_ATTRIBUTES psa,  
    //安全属性
       BOOL bInitialOwner,        //互斥对象是否开始就被调用该函数的线程所拥有
       PCTSTR pszName);           //该互斥内核对象的名字

      Windows Vista中还提供了一个函数用于创建一个互斥内核对象:

    HANDLE CreateMutexEx(
       PSECURITY_ATTRIBUTES psa,     
    //安全属性
       PCTSTR pszName,       //该互斥内核对象的名字
       DWORD dwFlags,        //互斥对象是否开始就被调用该函数的线程所拥有
       DWORD dwDesiredAccess);       //访问限制


      第1个函数中的bInitialOwner参数如果为TRUE,则创建的互斥内核对象一开始就被调用这个函数的线程所拥有,它的线程ID被设置为该线程的ID,递归计数器被设置为1。

      如果传递FALSE给这个参数,则互斥内核对象的线程ID和递归计数器被设置为0,表明该互斥内核对象不被任何线程所拥有,该互斥内核对象处于“已通知”状态。

      第2个函数的dwFlags的意义和第1个函数的bInitialOwner参数其实是一样的,0就好比FALSE,CREATE_MUTEX_INITIAL_OWNER就相当于TURE。

      这两个函数成功,返回互斥内核对象的句柄,失败返回NULL。

      你通过“名字”来可以打开一个已经创建了的互斥内核对象:

    HANDLE OpenMutex(
       DWORD dwDesiredAccess,     
    //访问限制
       BOOL bInheritHandle,       //是否允许返回的句柄被子进程继承
       PCTSTR pszName);           //名字

      创建了一个互斥内核对象,得到了它的句柄之后,就可以让它保护资源了。

      一个线程中(下面用T表示),在你需要访问资源之前,可以先调用“等待函数”,传递该互斥对象(下面用M表示)的句柄该这些等待函数,在等待函数内部,通过句柄查看M的线程ID,如果不为0,表明M处于“未通知”状态,线程T进入等待状态(有例外,下面会讲)。此时系统会记住这个情况,当M被其他线程释放,它的线程ID重新被设置为0的时候,系统会将一个等待在它上面的线程(比如T)的ID设置为M的线程ID,同时将M的递归计数器设置为1,允许该线程(比如T)进入可调度状态。

      注意,对于互斥对象的线程ID的比较和设置都是以“原子”的形式进行的,所以互斥内核对象是“线程安全”的。

      下面来讲那个例外的情况,这就是互斥内核对象允许以不正常的规则进行使用。也就是在一个互斥内核对象处于“未通知”状态的时候,一个等待在它上面的线程“或许”可以继续运行

      比如当前有一个处于“未通知状态”的互斥内核对象M,一个线程T(ID为X)。T调用等待函数等待M,这种情况下,通常T会进入等待状态。但是,系统查看T的ID和M的线程ID相同,都是X的情况下,线程并不会进入等待状态,而是保持在可调度状态。在线程成功等待互斥内核对象之后,互斥内核对象M的递归计数器加1。

      也就是说,一个互斥内核对象的递归计数器要大于1,就要让线程多次等待相同的互斥内核对象。

      一旦当前线程成功地等待到了一个互斥内核对象之后,该线程就可以独占某些资源,从而可以访问这些共享的资源了。试图访问这些资源的其他线程通过等待相同的互斥对象,就会进入等待状态之中。

      当前线程如果对资源访问结束,必须释放互斥内核对象,使用ReleaseMutex函数:

    BOOL ReleaseMutex(HANDLE hMutex);     //参数是互斥内核对象句柄

      该函数将互斥内核对象的递归计数减1。如果一个线程多次成功地等待一个互斥内核对象,就要同样以相同的次数调用ReleaseMutex函数,从而递减其递归计数,当互斥内核对象的递归计数减为0后,其线程ID被设置为0,进入“已通知”状态。
      当这个互斥内核对象进入“已通知”状态之时,系统查看当前是否有线程等待它,如果有,就以公平的原则选择其中一个线程,将这个互斥内核对象的线程ID设置为这个选中的线程的线程ID,互斥对象的递归计数被设置为1。

      综合上面所叙述的,可以总结出,互斥内核对象不同于其他内核对象,就是它有一个“线程所有权”的概念,这就使得互斥内核对象比较特殊。

      一个线程调用ReleaseMutex函数释放一个互斥对象,这时系统查看互斥对象的线程ID和这个线程的线程ID是否相同,如果相同,互斥对象的递归计数减1;否则ReleaseMutex不做任何工作,返回FALSE。

      还有一种现象,称做“互斥对象被抛弃”。

      假设一个互斥内核对象为一个线程所拥有,而这个线程却因为某些特殊的原因在终止,比如调用了ExitThread或TerminateThread函数,但是它在终止之前没有释放这个互斥对象。这个时候,系统能够跟踪拥有互斥内核对象的线程内核对象,系统知道这个互斥对象被一个线程抛弃了,就将互斥对象的线程ID设置为0, 将其递归计数设置为0。然后,系统查看是否有其他线程在等待这个互斥对象,如果有,就公平地选中一个,将互斥对象的线程ID设置为选中的线程的线程ID,这和前面的论述是一样的,差别是等待函数返回的值是WAIT_ABANDONED,而不是WAIT_OBJECT_0。这个时候,访问资源是不合适的,因为不知道资源处于何种状态。

    本来不打算写这篇的,但是文件的重要性大家都知道。在设备I/O中,有一种设备叫文件设备,这是一个抽象的概念,就把它理解为文件就行了。

      文件设备,可以通过CreateFile函数打开,得到一个文件对象句柄。

      在文件中,有两个比较重要的属性:

    1、文件大小:在32位中最大为4GB,64位中可以达到16EB。

    2、文件读写指针:这个指针表明读写位置,大小范围可以超出文件的大小。

      先讨论文件的大小。

      要得到文件的大小,可以使用GetFileSizeEx函数:

    BOOL GetFileSizeEx(
       HANDLE         hFile,     
    //文件对象句柄
       PLARGE_INTEGER pliFileSize);  //LARGE_INTEGER联合的指针,返回大小

      这个函数接受一个LARGE_INTEGER联合的指针,用来返回文件大小,这个结构可以表示64位值:

    typedef union _LARGE_INTEGER {
       
    struct {
          DWORD LowPart;    
    // 低32位值
          LONG HighPart;       // 高32位值

       };
       LONGLONG QuadPart;   
    // 64位值得
    } LARGE_INTEGER, *PLARGE_INTEGER;

      从这个定义可以看出,该联合可以用QuadPart表示一个64位值,也可以差分成两个32位值。这个联合有一个无符号数版本,叫做ULAGER_INTEGER联合,对应的3个成员都是保存的无符号数。

      还有一个函数可以得到一个文件的大小:

    DWORD GetCompressedFileSize(
       PCTSTR pszFileName,          
    //文件路径名
       PDWORD pdwFileSizeHigh); //文件大小如果大于4GB,高32位值由该参数返回

      这个函数接受一个文件的路径名称,返回文件大小的低32位值,高32位值由参数pdwFileSizeHigh返回。与GetFileSizeEx不同的是,该函数返回一个文件的物理大小,而GetFileSizeEx返回文件的逻辑大小。

      比如一个文件大小为100KB,它被压缩为85KB,如果使用GetFileSizeEx,则返回100KB,使用GetCompressedFileSize则返回85KB。

      与GetFileSizeEx不同的是,该函数接受一个字符串,指明文件路径,这就可以直接查询某个文件大小,而不要先打开它获得它的句柄。

      可以如下使用该函数:

    ULARGE_INTEGER ulFileSize;     //与LARGE_INTEGER联合类似,保存无符号数
    ulFileSize.LowPart = GetCompressedFileSize(TEXT("SomeFile.dat"),
       
    &ulFileSize.HighPart);     //取得当前目录下的SomeFile.dat文件大小


      这样,64位的文件大小存储在ulFileSize.QuadPart中。

      讨论完了文件的大小,下面来讨论文件读写指针。

      CreateFile函数创建或打开了一个文件内核对象,该内核对象中管理着一个“文件读写指针”。该指针指明了一个64位的偏移量。初始情况下,该指针设置为0,即你读取或写入数据的时候从文件开始处进行,即从偏移量为0的地方开始。每次读取或写入N字节的数据,系统更新该读写指针,使偏移量加上N个字节。比如下面代码反映了读取文件前100个字节的数据:

    BYTE pbFirst[50], pbSecond[50];
    DWORD dwNumBytes;
    HANDLE hFile 
    = CreateFile(TEXT("MyFile.dat"), ...); //指针初始化为0
    ReadFile(hFile, pbFirst, 50&dwNumBytes, NULL);    //读取第0~49字节
    ReadFile(hFile, pbSecond, 50&dwNumBytes, NULL);//读取第50~99字节

      需要注意的是,一个文件对象句柄对应一个读写指针,如果一个文件被打开多次,那么就有多个文件对象,每个文件对象管理着一个读写指针,这些指针相互之间不影响。比如下面的代码:

    BYTE pb[10];
    DWORD dwNumBytes;
    HANDLE hFile1 
    = CreateFile(TEXT("MyFile.dat"), ...); //指针初始化为0
    HANDLE hFile2 = CreateFile(TEXT("MyFile.dat"), ...); //指针初始化为0
    ReadFile(hFile1, pb, 10&dwNumBytes, NULL);  //读取第0~9字节
    ReadFile(hFile2, pb, 10&dwNumBytes, NULL);  //也是读取第0~9字节

      上面这段代码,hFile1和hFile2是同一个文件的两个不同的文件内核对象的句柄,这两个内核对象管理着两个不同文件指针,所以改变其中一个的读写指针,不会影响另一个。

      下面这段代码更能说明问题:

    BYTE pb[10];
    DWORD dwNumBytes;
    HANDLE hFile1 
    = CreateFile(TEXT("MyFile.dat"), ...); //读写指针初始化为0
    HANDLE hFile2;     //另一个文件句柄

    //将本进程内hFile1句柄值复制给本进程中的hFile2
    DuplicateHandle(
       GetCurrentProcess(), hFile1,
       GetCurrentProcess(), 
    &hFile2,
       
    0, FALSE, DUPLICATE_SAME_ACCESS);
    ReadFile(hFile1, pb, 
    10&dwNumBytes, NULL);   //读取第0~9字节
    ReadFile(hFile2, pb, 10&dwNumBytes, NULL);   //读取第10~19字节

      上面这段代码,使用DuplicateHandle函数复制句柄,使得两个句柄hFile1和hFile2共用同一个文件内核对象,因此读写指针也是共用的。

      可以使用SetFilePointerEx函数来定位文件读写指针:

    BOOL SetFilePointerEx(
       HANDLE         hFile,     
    //文件内核对象句柄
       LARGE_INTEGER  liDistanceToMove,     //64位数,移动字节数
       PLARGE_INTEGER pliNewFilePointer,    //返回新的文件读写指针位置
       DWORD          dwMoveMethod);        //移动方式


      该函数中dwMoveMethod告诉系统如何移动。FILE_BEGIN,表示从文件头开始移动;FILE_END,表示从文件尾往前移动;FILE_CURRENT,表示从当前读写指针位置移动。移动的位移量在第2个参数liDistaceToMove中。

      有几点需要注意

    • 将文件读写指针的位置设置为超过文件大小范围是合法的。这么做不会使得文件大小变大,除非调用函数SetEndOfFile。
    • 当打开文件使用函数CreateFile时,该函数的dwFlagsAndAttributes参数中包括FILE_FLAG_NO_BUFFERING,文件读写指针只能被设置为硬盘扇区的单位大小。
    • 没有GetFilePointerEx函数来取得当前文件指针位置,可以调用SetFilePointerEx函数来得到其位置,要把第二个参数设置为0,如下代码:
    LARGE_INTEGER liCurrentPosition = { 0 };
    SetFilePointerEx(hFile, liCurrentPosition,
                            
    &liCurrentPosition,FILE_CURRENT);

      当文件被关闭的时候,系统会在文件上设置一个结束位置,以确定该文件的大小。当然,你也可以自己设置文件的结束位置,以此来改变文件的大小。使用SetEndOfFile函数:

    BOOL SetEndOfFile(HANDLE hFile);

      该文件在当前的文件读写指针处设置文件的结束标志,来截断或扩展文件的大小。比如,你想设置一个文件的大小为1024字节的话,可以通过以下代码实现:

    HANDLE hFile = CreateFile(...);
    LARGE_INTEGER liDistanceToMove;
    liDistanceToMove.QuadPart 
    = 1024;
    //设置文件指针
    SetFilePointerEx(hFile, liDistanceToMove, NULL, FILE_BEGIN);
    SetEndOfFile(hFile);     
    //在文件指针处设置结束标志
    CloseHandle(hFile);
    前面曾经讲过,设备I/O的方式有两种:同步和异步。本篇介绍一下同步设备I/O。主要涉及到两个函数:ReadFile和WriteFile。

      不要被这两个函数的名称迷惑,不仅可以将这两个作用于文件,也可以作用于其他设备:比如管道、邮槽等。

      最简单的设备I/O,可以通过ReadFile和WriteFile这两个函数来实现:

    BOOL ReadFile(
       HANDLE      hFile,         
    //设备对象句柄
       PVOID       pvBuffer,      //读取缓冲区
       DWORD       nNumBytesToRead,     //读取的字节数
       PDWORD      pdwNumBytes,         //返回实际读取的字节数
       OVERLAPPED* pOverlapped);        //重叠结构指针,仅在异步方式有用
    BOOL WriteFile(
       HANDLE      hFile,
       CONST VOID  
    *pvBuffer,
       DWORD       nNumBytesToWrite,
       PDWORD      pdwNumBytes,     
    //返回实际写入的字节数
       OVERLAPPED* pOverlapped);

      在同步方式下使用这2个函数进行设备I/O,在同步模式下,两个函数的最后一个参数pOverlapped都要设置为NULL。另外,必须要注意这一点:就是在用CreateFile创建或打开设备之时,其FLAG参数不能包括FLAG_FILE_OVERLAPPED,否则系统认为你想要异步地实现设备I/O。

      另外,ReadFile只能读取这些设备,即在使用CreateFile创建或打开设备的时候,该函数的FLAG参数中包括GENERIC_READ。而WriteFile只能写入这些设备,即使用CreateFile函数的时候,FLAG参数包括GENERIC_WRITE。

      邮槽、管道、文件、串行端口等设备是有自己的高速缓存的。如果在CreateFile函数的FLAG参数中没有包括FILE_FLAG_NO_BUFFERING,也就是可以将写入的数据暂存在缓冲区中,那么可以通过FlushFileBuffers来强行将暂存在与设备有关的缓冲区中的全部数据写入到设备中。

    BOOL FlushFileBuffers(HANDLE hFile);

      同步方式的设备I/O实现简单,但是缺点也是明显的,就是会阻碍有关线程中的其他与设备I/O无关的操作。因为设备I/O函数直到设备I/O请求结束才返回,如果数据量大,很可能会阻碍其他无关的操作。

      为了解决这个问题,你应该尽量使用异步的设备I/O。但是可惜的是,Windows API中,没有为CreaetFile这个函数提供任何异步的方式来实现。Windows Vista提供了另一种方法:中途取消同步设备I/O。可以通过使用函数CancelSynchronousIo来取消一个线程之内的正在进行的同步设备I/O操作。

    BOOL CancelSynchronousIo(HANDLE hThread);     //参数是线程句柄

      该函数接受一个线程句柄,该句柄是一个正在等待同步设备I/O操作完成的线程的句柄。该句柄在创建或打开的时候,必须具有THREAD_TERMINATE操作权限。如果你调用CreateThread或_beginthreadex函数来创建线程,那么返回的线程句柄就包含THREAD_TERMINATED的操作权限。如果使用OpenThread函数来获得一个已创建的线程的句柄,那么就传递THREAD_TERMINATED给dwDesiredAccess参数(第1个参数)。如果没有设置该权限,那么CancelSynchronousIo返回FALSE,调用GetLastError返回ERROR_ACCESS_DENIED(访问拒绝错误)。

      如果线程已经结束了等待设备I/O,那么再调用CancelSynchronousIo函数会返回TRUE,而不是FLASE,调用GetLastError则返回ERROR_OPERATION_ABORTED(操作失败错误)。

      如果线程并不是等待在设备I/O的返回上,那么调用该函数会返回FALSE,随后调用GetLastError会返回ERROR_NO_FOUND(未找到的错误)。

     异步设备I/O适用于大数据量和高性能的场合,比如服务器。

      要使用异步设备I/O,在调用CreateFile来打开或创建一个设备的时候,让参数dwFlagsAndAttributes包括FILE_FALG_OVERLAPPED,这意味着想让打开的设备可以被异步访问。

      为了发送一个I/O请求给一个设备,也就是让一个I/O请求进入I/O队列,你可以使用ReadFile和WriteFile这两个函数:

    BOOL ReadFile(
       HANDLE      hFile,
       PVOID       pvBuffer,
       DWORD       nNumBytesToRead,
       PDWORD      pdwNumBytes,
       OVERLAPPED
    * pOverlapped);
    BOOL WriteFile(
       HANDLE      hFile,
       CONST VOID  
    *pvBuffer,
       DWORD       nNumBytesToWrite,
       PDWORD      pdwNumBytes,
       OVERLAPPED
    * pOverlapped);

      当这两个函数被呼叫,系统通过第一个参数hFile,来查看该句柄指明的设备在打开的时候是否使用了FILE_FLAG_OVERLAPPED,如果使用了,这两个函数执行异步设备I/O,反之,则执行同步设备I/O。当使用异步I/O方式的时候,在调用这两个函数的时候,可以将NULL传递给pdwNumBytes参数,因为不知道何时设备I/O完成,因此使用这个参数没有多大意义。

      注意最后一个参数,是一个OVERLAPPED结构的指针:

    typedef struct _OVERLAPPED {
       DWORD  Internal;     
    // 错误代码(出口参数,返回)
       DWORD  InternalHigh; // 传输的数据大小,以字节为单位(出口参数,返回)
       DWORD  Offset;       // 低32位偏移量(入口参数,输入)
       DWORD  OffsetHigh;   // 高32位偏移量(入口参数,输入)
       HANDLE hEvent;       // 事件内核对象句柄(入口参数,输入)
    } OVERLAPPED, *LPOVERLAPPED;

      该结构包含5个成员,其中的3个——Offset、OffsetHigh、hEvent应该在调用ReadFile和WriteFile之前被初始化,另外的2个——Internal、InternalHigh会在I/O完成的时候被设备驱动程序所设置,下面细述一下:

    • Offset、OffsetHigh —— 在使用异步设备I/O来操纵“文件设备”的时候,文件读写指针被忽略,此时I/O的偏移量由OVERLAPPED结构中的Offset和OffsetHigh决定。另外,在“非文件设备”中,这两个成员不会被忽略,一般必须要设置为0。
    • hEvent —— 一个事件内核对象句柄,可以有多种使用方法,后面会讲到。
    • Internal —— 保存I/O错误码,当你发送一个I/O请求的时候,该参数被设置为STATUS_PENDING,指明没有错误发生,因为操作还没有开始。你可以使用HasOverlappedIoCompleted宏来查看一个异步设备I/O是否完成,该结构接受一个OVERLAPPED结构指针,如果I/O请求完成返回TRUE。如果I/O请求仍然没有开始,返回FALSE。
    • InternalHigh —— 异步I/O请求完成的时候,该成员里保存了传送数据量的字节数。

      当异步I/O请求完成之后,你可以接受到一个OVERLAPPED结构的指针。一般可以让一个C++类从OVERLAPPED结构派生,类中加入一些其他信息,使得更容易处理。然后当使用ReadFile和WriteFile函数的时候,可以传递这个C++类对象的指针,当I/O完成之后,接受该结构的时候,可以将其转换为C++类对象,不但可以获得其5个成员,还可以获得类中的其他信息。

      使用异步设备I/O的时候,要注意以下三点:

      1、设备驱动程序不一定会按照一个“先进先出”(FIFO)的顺序来处理设备I/O请求,因此如下编码不会保证先读后写:

    OVERLAPPED o1 = { 0 };
    OVERLAPPED o2 
    = { 0 };
    BYTE bBuffer[
    100];
    ReadFile (hFile, bBuffer, 
    100, NULL, &o1);   //
    WriteFile(hFile, bBuffer, 100, NULL, &o2);   //

      2、以异步的方式进行I/O请求的是,驱动程序可能会选择同步的方式。当你读取一个文件的时候,如果系统发现读取的数据在cache中,且数据有效,那么该I/O请求就不需要驱动程序了,而是直接将cache中的数据复制到你的缓冲区中。驱动在某些操作上一直使用同步方式,比如在NTFS格式上的文件压缩,扩展文件长度,添加文件信息等。

      这个时候,如果ReadFile和WriteFile返回非0值,则表明它以同步方式进行。如果返回FLASE,说明发生了一个错误,这个时候可以通过GetLastError来取得信息,如果返回ERROR_IO_PENDING,则说明I/O请求成功提交,但没有完成。

      3、数据缓冲区和OVERLAPPED结构在异步I/O请求完成之前不能被移动或释放。当设备驱动准备处理你的I/O请求的时候,它将数据传送到pvBuffer参数对应的地址上去,并访问OVERLAPPED结构中的Offset等成员。当I/O请求完成之后,设备驱动更新OVERLAPPED结果中的Internal和InternalHigh成员。因此,不能在I/O请求完成之前移动或释放数据缓冲区和OVERLAPPED结构,否则,内存数据会被破坏,而且在每次调用ReadFile或WriteFile的时候,都必须分配一个单独的OVERLAPPED结构。

      比如,下面的代码是有BUG的:

    VOID ReadData(HANDLE hFile)
    {
       OVERLAPPED o 
    = { 0 };
       BYTE b[
    100];
       ReadFile(hFile, b, 
    100, NULL, &o);
    }  
    //此时缓冲区b和OVERLAPPED结构o都被释放

      你可以将一个设备I/O请求取消排队,即撤消该请求。可以有如下方法:

      1、在一个线程中调用CancelIo函数,可以取消该线程发送给指定设备有关的所有I/O请求,除了指定的设备是“I/O完成端口”。

    BOOL CancelIo(HANDLE hFile);     //参数是设备对象句柄

      2、取消与一个设备有关的所有I/O请求,关闭这个设备句柄即可。

      3、当一个线程结束,系统自动取消该线程发送的所有I/O请求,除了发送给“I/O完成端口的”I/O请求。

      4、如果想取消某一个特定的I/O请求,可以使用CancelIoEx函数,传递一个OVERLAPPED结构指针给它:

    BOOL CancelIoEx(HANDLE hFile, LPOVERLAPPED pOverlapped);

      该函数可以跨线程使用,也就是在T1线程内发送的I/O请求,可以在T2线程内通过该函数结束之。因为每个I/O请求都需要一个唯一的OVERLAPPED结构,所以该OVERLAPPED结构就标识了一个I/O请求。如果传递NULL给CancelIoEx函数的第2个参数,那么就会取消与hFile对应的设备的所有I/O请求。

      取消一个I/O请求,该I/O请求会结束,同时错误码被设置为ERROR_OPERATION_ABORTED。

    上一篇,讨论了如何发送I/O请求。在异步的设备I/O请求方式下,要考虑的问题就是当I/O请求完成之后,驱动程序如何通知你的应用程序。本篇主要讨论获得通知的方法。

      Windows 提供了4种不同的技术方法来得到I/O完成的通知。

    技术 

    概要 

    通知一个设备内核对象

    当一个设备同时有多个I/O请求的时候,该方法不适用。

    允许一个线程发送一个I/O请求,另一个线程处理之。

    通知一个事件内核对象

    允许一个设备同时有多个I/O请求。

    允许一个线程发送一个I/O请求,另一个线程处理之。

    告警I/O

    允许一个设备同时有多个I/O请求。

    必须在同一个线程中发送并处理同一个I/O请求。

    I/O完成端口

    允许一个设备同时有多个I/O请求。

    允许一个线程发送一个I/O请求,另一个线程处理之。

    该方法伸缩性好,而且性能高。

      本篇主要讨论前3种。

    通知一个设备内核对象

      在Windows中,一个设备内核对象可以处于“已通知”或“未通知”状态。ReadFile和WriteFile在发送I/O请求之前让指定的设备内核对象处于“未通知”状态。当设备驱动程序完成了I/O请求,驱动程序将设备内核对象设置为“已通知”状态。

      一个线程可以查看一个异步的I/O请求是否完成,通过等待函数即可实现:WaitForSingleObject或WaitForMultipleObject等。这就意味着,这种实现的方式不是完完全全的“异步”,最终有点“同步”的味道,因为这些等待函数可能会导致线程进入阻塞状态。

      可以如下地编码来使用这种方法:

    //创建或打开设备内核对象,注意使用FILE_FLAG_OVERLAPPED旗标
    HANDLE hFile = CreateFile(..., FILE_FLAG_OVERLAPPED, ...);
    BYTE bBuffer[
    100];     //I/O缓冲区
    OVERLAPPED o = { 0 };     //重叠结构,不要忘记初始化
    o.Offset = 345;     //偏移量
    BOOL bReadDone = ReadFile(hFile, bBuffer, 100, NULL, &o);   //读取数据
    DWORD dwError = GetLastError();

    //ReadFile返回FLASE,但是错误码dwError表明I/O即将开始
    if (!bReadDone && (dwError == ERROR_IO_PENDING))
    {
         
    //等待I/O请求完成
         WaitForSingleObject(hFile, INFINITE);
         bReadDone 
    = TRUE;
    }
    if (bReadDone)
    {
         
    // 操作成功,可以查看OVERLAPPED结构中的各个字段和缓冲区中的数据
         
    // o.Internal 包含了I/O错误码
         
    // o.InternalHigh 包含了I/O传输字节数
         
    // 缓冲区包含了读取的数据
    }
    else
    {
         
    // 错误发生,bReadDone为FLASE,且错误码dwError指明一个错误
    }

      这种方法是十分简单的,实现起来十分容易,但是有一个明显的缺点,就是无法处理多个I/O请求。因为一旦一个I/O请求完成,等待函数就会返回,无法识别是哪个I/O请求完成了。

    通知一个事件内核对象

      这种方法可以处理多个同时的I/O请求。

      记得OVERLAPPED结构中有一个hEvent成员吧,该成员是一个事件内核对象。使用这种方法,你必须使用CreateEvent函数来创建一个事件内核对象,并初始化那个hEvent成员。当一个异步I/O请求完成设备驱动程序查看OVERLAPPED中的hEvent是否为NULL,如果不是,驱动程序通过SetEvent通知该事件内核对象,同时也使得设备内核对象进入“已通知”状态。但是,你应该等待在该事件内核对象上。

      你可以让Windows不通知“文件内核对象”,这样可以少许提高一点性能,通过呼叫函数SetFileCompletionNotificationModes即可,传递一个设备内核对象句柄和FILE_SKIP_SET_EVENT_ON_HANDLE旗标:

    BOOL SetFileCompletionNotificationModes(HANDLE hFile, UCHAR uFlags);

      为了处理多个I/O请求,你必须为每个I/O请求创建一个独立的事件内核对象,并将之初始化OVERLAPPED结构中的hEvent。然后可以通过WaitForMultipleObject来等待这些事件内核对象。这种方法可以实现一个设备上的多个I/O请求的处理。可以如下编码:

    //创建或打开设备,注意使用FILE_FLAG_OVERLAPPED
    HANDLE hFile = CreateFile(..., FILE_FLAG_OVERLAPPED, ...);
    BYTE bReadBuffer[
    10];     //读缓冲区
    OVERLAPPED oRead = { 0 };     //定义OVERLAPPED结构,并初始化之
    oRead.Offset = 0;
    oRead.hEvent 
    = CreateEvent(...);     //创建事件内核对象,与读操作相关
    ReadFile(hFile, bReadBuffer, 10, NULL, &oRead);

    BYTE bWriteBuffer[
    10= { 0123456789 };
    OVERLAPPED oWrite 
    = { 0 };
    oWrite.Offset 
    = 10;
    oWrite.hEvent 
    = CreateEvent(...);     //另一个事件内核对象,与写操作相关
    WriteFile(hFile, bWriteBuffer, _countof(bWriteBuffer), NULL, &oWrite);

    //可在此执行其他操作
    //......

    HANDLE h[
    2];
    h[
    0= oRead.hEvent;     //与读相关的事件对象
    h[1= oWrite.hEvent;    //与写相关的事件对象
    DWORD dw = WaitForMultipleObjects(2, h, FALSE, INFINITE);     //等待
    switch (dw – WAIT_OBJECT_0)
    {
         
    case 0:   //读操作完成
              break;

         
    case 1:   //写操作完成
              break;
    }

      当然,也可以把上面代码拆分成两个线程执行,上面半段为发送I/O请求的放在一个线程中,下面处理I/O请求完成的放在另一个线程中。

      在I/O请求完成之后,收到通知之后,可以得到有关OVERLAPPED结构的信息,通过函数GetOverlappedResult:

    BOOL GetOverlappedResult(
       HANDLE      hFile,        
    //设备对象句柄
       OVERLAPPED* pOverlapped,  //OVERLAPPED结构指针,返回OVERLAPPED
       PDWORD      pdwNumBytes,  //返回传输的字节数
       BOOL        bWait);       //是否等到I/O结束才返回

    告警I/O

      当一个线程被创建的时候,系统也创建一个与该线程关联的队列,这个队列称为“异步过程调用”(APC)队列。当发送一个I/O请求的时候,你可以告诉驱动程序在APC队列中加入一个记录。当I/O请求完成之后,如果线程处于“待命状态”,则该记录中的回调函数可以被调用。

      让I/O请求完成的通知进入线程的APC队列,即在APC队列中添加一个I/O请求完成通知的记录,可以使用如下两个函数:

    BOOL ReadFileEx(
       HANDLE      hFile,        
    //设备对象句柄
       PVOID       pvBuffer,     //数据缓冲区
       DWORD       nNumBytesToRead,  //预期传输的数据
       OVERLAPPED* pOverlapped,      //OVERLAPPED结构指针
       LPOVERLAPPED_COMPLETION_ROUTINE pfnCompletionRoutine);//回调函数指针
    BOOL WriteFileEx(
       HANDLE      hFile,
       CONST VOID  
    *pvBuffer,
       DWORD       nNumBytesToWrite,
       OVERLAPPED
    * pOverlapped,
       LPOVERLAPPED_COMPLETION_ROUTINE pfnCompletionRoutine);


      注意一下函数的最后一个参数pfnCompletionRoutine,是一个函数指针,接受一个回调函数,这个函数就是被记录到APC队列的函数,函数头必须按如下格式书写:

    VOID WINAPI CompletionRoutine(     //函数名可以任意
       DWORD       dwError,     //错误码
       DWORD       dwNumBytes,  //传输的数据
       OVERLAPPED* po);         //OVERLAPPED结构

      当使用ReadFileEx和WriteFileEx函数的时候,传递回调函数的地址,当驱动程序完成I/O请求之后,它在线程APC队列中添加一个记录,这个记录包含这个回调函数的地址和起初发送I/O请求时候的OVERLAPPED结构地址。

      当线程进入“待命状态”,系统检测线程APC队列,然后调用回调函数,并设置其3个参数。

      当I/O请求完成,系统不会马上调用记录在APC队列中的回调函数,因为线程可能没有进入“待命状态”。为了调用回调函数,你必须让线程进入“待命状态”,可以通过一些带“Ex”的等待函数来完成:

    DWORD SleepEx(
       DWORD dwMilliseconds,
       BOOL  bAlertable);

    DWORD WaitForSingleObjectEx(
       HANDLE hObject,
       DWORD  dwMilliseconds,
       BOOL   bAlertable);

    DWORD WaitForMultipleObjectsEx(
       DWORD   cObjects,
       CONST HANDLE
    * phObjects,
       BOOL    bWaitAll,
       DWORD   dwMilliseconds,
       BOOL    bAlertable);

    BOOL SignalObjectAndWait(
       HANDLE hObjectToSignal,
       HANDLE hObjectToWaitOn,
       DWORD  dwMilliseconds,
       BOOL   bAlertable);

    BOOL GetQueuedCompletionStatusEx(
       HANDLE hCompPort,
       LPOVERLAPPED_ENTRY pCompPortEntries,
       ULONG ulCount,
       PULONG pulNumEntriesRemoved,
       DWORD dwMilliseconds,
       BOOL bAlertable);

    DWORD MsgWaitForMultipleObjectsEx(
       DWORD   nCount,
       CONST HANDLE
    * pHandles,
       DWORD   dwMilliseconds,
       DWORD   dwWakeMask,
       DWORD   dwFlags);     
    //使用MWMO_ALERTABLE使线程进入“待命状态”

      除了MsgWaitForMultipleObjectEx函数之外,上面其余5个函数的最后一个参数bAlertalbe,指明了是否要线程进入“待命状态”,如果需要,请传递TRUE。

      当你调用上面这些等待函数,并让线程进入“待命状态”,系统首先查看线程的APC队列,如果至少有一个记录在APC队列中,系统不会让你的线程进入阻塞状态,而是调用回调函数,并提供其3个参数。当回调函数返回给系统,系统再次检查APC队列中的记录,如果存在,继续调用回调函数。否则,回调函数返回给用户(即普通的返回)。

      注意,如果APC队列中存在记录,那么调用上述等待函数,不会让你的线程进入阻塞状态。只有当APC队列中没有记录,调用这些函数的时候才会让线程进入阻塞状态,直到等待的内核对象为“已通知”状态或APC队列中出现记录。由于线程处于“待命状态”,因此一点APC队列中出现一个记录,那么系统唤醒你的线程,呼叫回调函数,清空APC队列,回调函数返回,线程继续执行。

      这6个等待函数返回的值说明了它们是因为什么原因而返回的。如果返回WAIT_IO_COMPLETION,那么说明了你的线程继续执行,因为至少一个APC记录被处理。如果返回其他的值,那么说明这些等待函数等待的内核对象为“已通知”状态(也可能是互斥内核对象被抛弃)或者等待超时。

      还有需要注意的是,系统调用APC回调函数,不是按FIFO的顺序,而是随意的。注意如下代码:

    hFile = CreateFile(..., FILE_FLAG_OVERLAPPED, ...);
    ReadFileEx(hFile, ..., ReadRoutine1);   
    //第一次读,回调函数ReadRoutine1
    WriteFileEx(hFile, ..., WriteRoutine1); //第一次写,回调函数WriteRoutine1
    ReadFileEx(hFile, ..., ReadRoutine2);   //第二次读,回调函数ReadRoutine2
    SomeFunc();   //其他一些操作
    SleepEx(INFINITE, TRUE);     //等待,线程进入“待命状态”

      线程发起了3次I/O请求,并给出了3个回调函数ReadRoutine1、WriteRoutine1、ReadRoutine2。然后线程执行SomeFunc函数,执行完成之后进入无限等待,当I/O请求结束,会调用3个APC队列中的回调函数。

      需要注意的是,如果3个I/O请求都在SomeFunc函数执行的时候完成,那么回调函数的调用顺序可能不是ReadRountine1、WriteRoutine1、ReadRoutine2,这个顺序是任意的。

      Windows提供了一个函数可以手动在一个线程的APC队列加入一个记录(即加入一个回调函数):

    DWORD QueueUserAPC(
       PAPCFUNC  pfnAPC,     
    //APC回调函数指针
       HANDLE    hThread,     //线程对象句柄
       ULONG_PTR dwData);  //传递给参数pfnAPC所对应的回调函数的参数

      其中第1个参数是一个函数指针,是一个回调函数,被记录到线程的APC队列,其函数头格式如下:

    VOID WINAPI APCFunc(ULONG_PTR dwParam);

      QueueUserAPC函数的第2个参数指明了你想要设置的哪个线程的APC队列。第3个参数dwData就是传递给回调函数APCFunc的参数。QueueUserAPC可以让你的线程摆脱阻塞状态,此时上述等待函数返回码为WAIT_IO_COMPLETION。

      最后要讲的就是告警I/O的缺点:

    • 告警I/O的回调函数所提供的参数较少,因此处理上下文内容只能通过全局变量来实现。
    • 使用告警I/O,意味着发送I/O请求和处理I/O完成通知只能放在同一个线程中,如果发送多个I/O请求,该线程就不得不处理每个I/O完成通知,其他线程则会比较 空闲,这样会造成不平衡。
    上一篇讲了3种接受异步I/O请求完成的通知的方法,分别是:通知一个设备内核对象、通知一个事件内核对象、告警I/O。

      本篇主要讲另一种接受异步I/O请求的方法——I/O完成端口。这是性能最高,且扩充性最好的方法。但是实现比较复杂。

     

      介绍I/O完成端口之前介绍两种服务器线程模型:

    • 连续模型:单个线程等待一个客户的请求,一旦有一个客户发出请求,该线程唤醒然后处理客户的请求。
    • 并发模型:单个线程等待一个客户的请求,一旦有一个客户发出请求,该线程创建另一个线程来处理请求。在新创建的线程处理请求的同时,原来等待请求的线程通过循环继续等待另一个客户的请求。当处理请求的线程处理完毕之后,自动销毁。

      连续模型最大的缺点就是无法同时处理多个请求。它只能等待、处理、等待、处理……如此交替进行。当有2个请求同时到来时,只能处理其中之一,第2个请求必须等待直到第1个请求处理完毕。Ping服务器就是典型的连续模型。

      并发模型,让一个线程专门地等待请求,该线程可以为每一个请求创建一个线程来处理之。其优点是等待请求的线程所做的工作很少,默认状态为阻塞状态。当一个客户请求到来的时候,该线程被唤醒,然后创建一个新的线程来处理这个请求,然后这个线程继续等待另一个请求。这样,当有多个客户请求同时到来的时候,它们可以几乎同时被处理。但是当客户请求过多,那么就会存在太多的处理线程,这些线程都是可以被调度的,那么就会出现很多次的“线程转换”,这样,Windows内核会花费大量的时间在“线程转换”这个工作上,从而浪费了大量的时间。Windows为了解决这个问题,提供了“I/O完成端口”内核对象。

     

      不妨设想一下,如果事先创建了一些线程,让这些线程处于等待状态,然后将所有用户的请求都投递到一个消息队列中,然后这些线程被唤醒,逐一地从消息队列中取出请求并进行处理,就可以避免为每个用户开辟线程,节省资源,也提高了线程利用率。其实I/O完成端口就是基于这样思想的产物。感觉就是一个“消息队列”,与本身的名字“I/O完成端口”没有很大的联系。

     

    创建I/O完成端口

      I/O完成端口可以称为是最复杂的内核对象,可以使用CreateIoCompletionPort创建一个I/O完成端口内核对象:

    HANDLE CreateIoCompletionPort(
       HANDLE    hFile,          
    //设备句柄
       HANDLE    hExistingCompletionPort, //已经创建的I/O完成端口对象句柄
       ULONG_PTR CompletionKey,           //一个完成Key,相当于完成标号
       DWORD     dwNumberOfConcurrentThreads); //允许同时运行的线程个数

     

      乍看一下这个函数,很难理解。其实,这个函数有两个功能:创建I/O完成端口,将一个I/O完成端口与一个设备关联起来。因此,可以将该函数拆开。下面的函数CreateNewCompletionPort用来创建一个I/O完成端口:

    HANDLE CreateNewCompletionPort(DWORD dwNumberOfConcurrentThreads)
    {
         
    return(CreateIoCompletionPort(INVALID_HANDLE_VALUE, NULL, 0,
              dwNumberOfConcurrentThreads));
    }

     

      这个函数接受一个参数,并在内部调用CreateIoCompletionPort,将其前3个参数设置为INVALID_HANDLE_VLAUE,NULL,0。并保留最后一个参数给用户,如此便创建了一个I/O完成端口,参数dwNumberOfConcurrentThreads告诉I/O完成端口当前允许有多少个线程可以执行,如果传递0,则表示允许执行的线程个数没有限制。这个参数就是为了防止“线程切换”过于频繁。你可以动态地增加它的值,这样来测试一个合理的可运行线程数,以达到性能最佳。

     

    关联I/O完成端口与设备

      当你创建了一个I/O完成端口,内核实际上创建了5个数据结构:

    1、设备列表:与创建的I/O完成端口关联的设备

    2、I/O请求完成队列(FIFO):

    3、等待线程队列(LIFO)

    4、释放线程列表

    5、暂停线程列表

     

      第1个数据结构:设备列表指明了与这个I/O完成端口关联的设备,可以是一个设备,也可以是多个设备。你可以通过CreateIoCompletionPort函数关联设备和I/O完成端口,也可以将该函数拆开,使用如下函数:

    BOOL AssociateDeviceWithCompletionPort(
         HANDLE hCompletionPort,     
    // I/O完成端口内核对象句柄
         HANDLE hDevice,                 // 设备内核对象句柄
         DWORD dwCompletionKey)  // 完成Key
    {
         HANDLE h 
    = CreateIoCompletionPort(hDevice, hCompletionPort, 
                            dwCompletionKey, 
    0);
         
    return (h == hCompletionPort);
    }

     

      这个函数提供了一个I/O完成端口句柄和一个设备句柄,并将两者关联起来。其中最后一个参数,是一个完成Key,在处理I/O请求完成的通知的时候,这个值才有用,它只是对你有意义,系统不会注意它。

      每次调用这个,系统在I/O完成端口的“设备列表”这个数据结构中添加了一个记录,这个记录指明了与这个I/O完成端口相关联的设备。

      由于CreateIoCompletionPort函数比较复杂,因此建议将其拆开使用,或者也可以同时创建I/O完成端口并关联设备,如下编码:

    #define CK_FILE 1
    HANDLE hFile 
    = Create(...);
    // 创建I/O完成端口并将hFile最代表的设备关联起来,允许可运行线程数为2
    HANDLE hCompletionPort = CreateCompletionPort(hFile, NULL, CK_FILE, 2);

     

      第2个数据结构是“I/O请求完成队列”。当一个异步设备I/O请求完成,系统查看该设备是否与一个I/O完成端口关联,如果是,系统在“I/O请求完成队列”的队尾加上一个“已经完成的I/O请求”的记录。队列中的每个记录指明以下内容:1、传输的数据的字节数;2、设备与I/O完成端口关联时候的完成Key;3、I/O请求的OVERLAPPED结构指针;4、一个错误码。

     

    取得I/O完成端口状态信息

      当你的服务器系统启动,应该创建一个I/O完成端口,然后创建一个线程池来处理客户请求,一般而言,线程池中线程的数量为CPU的2倍。

      线程池中的所有线程所执行的功能是一样的,这些线程往往进入阻塞状态来等待设备I/O完成,可以通过GetQueuedCompletionStatus函数实现:

    BOOL GetQueuedCompletionStatus(
       HANDLE       hCompletionPort,          
    // I/O完成端口对象句柄
       PDWORD       pdwNumberOfBytesTransferred,     //传输数据的字节数
       PULONG_PTR   pCompletionKey,       //关联的完成Key
       OVERLAPPED** ppOverlapped,         //OVERLAPPED结构的指针的地址
       DWORD        dwMilliseconds);      //等待时间(毫秒)


      这个函数让线程等待一个特定的I/O完成端口,通过第一个参数指明这个I/O完成端口。这个函数使得呼叫它的线程进入等待状态,直到在这个I/O完成端口的“I/O请求完成队列”中出现了一个记录,或者参数dwMilliseconds指明的时间超出。

     

      第3个数据结构:“等待线程队列”,指明了所有等待在这个I/O完成端口上的线程,这些线程都是因为呼叫GetQueuedCompletionStatus函数而等待一个I/O完成端口的,这些线程的ID记录在这个队列中,使得I/O完成端口可以知道哪些线程正在等待。当一个与I/O完成端口关联的设备完成了一个异步设备I/O请求的时候,“I/O请求完成队列”的队尾会出现一个记录,此时I/O完成端口唤醒在“等待线程队列”中的一个线程,这个线程呼叫的GetQueuedCompletionStatus函数会返回,并得到传输数据的字节数、完成Key、OVERLAPPED结构的地址。

      确定GetQueuedCompletionStatus函数返回的原因比较复杂,可以通过下面编码确定之:

    DWORD dwNumBytes;         //传输数据的字节数
    ULONG_PTR CompletionKey;  //完成Key
    OVERLAPPED* pOverlapped;  //OVERLAPPED结构指针

    // hIOCP是一个I/O完成端口对象句柄,在其他地方被创建
    BOOL bOk = GetQueuedCompletionStatus(hIOCP,
              
    &dwNumBytes, &CompletionKey, &pOverlapped, 1000);
    DWORD dwError 
    = GetLastError();     //取得错误码

    if (bOk)
    {
         
    // 等待成功,一个I/O请求完成了,可以处理之
    }
    else
    {
         
    if (pOverlapped != NULL)
         {
              
    // I/O请求失败,dwError错误码包含了错误的原因
          }
         
    else
         {
              
    if (dwError == WAIT_TIMEOUT)
              {
                   
    // 等待时间超出,没有记录出现在“I/O请求完成队列”
               }
              
    else
              {
                  
    // 错误地呼叫GetQueuedCompletionStatus,比如句柄无效
                    
    // dwError错误码中包含错误的原因
               }
         }
    }

     

      要注意的是,“I/O请求完成队列”中的记录是按FIFO的方式入队和出队的。而“等待线程队列”中的线程是按LIFO的方式进出的,很像堆栈(但是作者就说是queue)。

     

      在Windows Vista中,如果你希望很多I/O请求被同时提交或处理,你不需要增加很多线程,而可以通过GetQueuedCompletionStatusEx来取得多个I/O请求完成的结果:

    BOOL GetQueuedCompletionStatusEx(
      HANDLE hCompletionPort,     
    //I/O完成端口句柄
      LPOVERLAPPED_ENTRY pCompletionPortEntries,     //I/O请求完成记录数组
      ULONG ulCount,     //I/O请求完成记录的个数
      PULONG pulNumEntriesRemoved,    //实际取得的I/O请求完成记录
      DWORD dwMilliseconds,   //等待时间
      BOOL bAlertable);       //是否让线程进入“待命状态”,一般设置为FALSE


      该函数的第2个参数是一个指向结构OVERLAPPED_ENTRY的地址(一般是一个该结构的数组),该结构定义如下:

    typedef struct _OVERLAPPED_ENTRY {
       ULONG_PTR lpCompletionKey;     
    //完成Key
       LPOVERLAPPED lpOverlapped;     //OVERLAPPED指针
       ULONG_PTR Internal;                 //该字段应该避免使用
       DWORD dwNumberOfBytesTransferred;   //传输数据的字节数
    } OVERLAPPED_ENTRY, *LPOVERLAPPED_ENTRY;

     

      本书中有一节“How the I/O Completion Port Manages the Thread Pool

    ”,感觉没有必要说了,看看就行,都是内部细节。

      还有要讲的就是线程池中应该有多少个线程。看过一些资料,本书上说是CPU个数的2倍,还有一些资料上说是2*CPU个数+2,这个感觉也没有什么好讲的,具体问题具体分析吧,呵呵。

     

    模仿完成的I/O请求

      你可以模仿一个完成的I/O请求,让某个等待在I/O完成端口上的线程唤醒并执行。这也是一种线程间通信的机制。你可以通过PostQueuedCompletionStatus实现之:

    BOOL PostQueuedCompletionStatus(
       HANDLE      hCompletionPort,    
    // I/O完成对象句柄
       DWORD       dwNumBytes,         // 预期传递数据的字节数
       ULONG_PTR   CompletionKey,      // 完成Key
       OVERLAPPED* pOverlapped);      // OVERLAPPED结构指针

     

      该函数在I/O完成端口的“I/O请求完成队列”中加入一个记录,这个记录对应的一些数据由该函数的第2、3、4个参数给出。调用成功,该函数返回TRUE。

     

    I/O完成端口使用步骤

      我以网络服务的套接字为例,说明一下I/O完成端口的使用步骤:

    1、初始化套接字(Ws2_32.dll)——WSAStartup

    2、创建一个I/O完成端口

    3、创建一些线程,可以包含一个监听线程和若干个等待状态的处理线程

    4、创建一个套接字socket,并邦定(bind),然后监听(listen)

    5、反复循环,调用accept等待客户请求连接,

    6、将连接进来的套接字与I/O完成端口关联起来

    7、投递一个处理信息的请求,可以使用PostQueuedCompletionStatus,唤醒处理线程,从而让处理线程进行连接请求处理。

      如此重复5~7即可。

  • 相关阅读:
    像素与豪米的转换
    C#中的事件和委托
    .Datagridview数据写入DataTable
    C# winform DataGridView 常见属性
    c# winform 用代码修改DataGridView列头的名字,设置列名,修改列名
    SVN常用命令
    (装载)C#中AppDomain.CurrentDomain.BaseDirectory与Application.StartupPath的区别
    C# WinForm dataGridView 技巧小结
    IPV4二进制显示
    Microsoft SQL Server 2005技术内幕:TSQL查询 PerformanceDB.sql
  • 原文地址:https://www.cnblogs.com/lzjsky/p/1757268.html
Copyright © 2020-2023  润新知