近来学习Windows内核方面的东西,觉得对I/O处理过程没有一个总体的概念。于是,就花了一点时间搜集了很多这方面的资料并自己总结了一下。下面说说我自己的理解。
在Windows内核中的I/O请求基本上是通过 I/O Request Packet (IRP)完成的。下面,我就来详细地说下IRP请求是怎么样一步一步完成的。 
      首先,我们就需要知道IRP是怎么产生。IRP是由I/O管理器发出的,I/O管理器是用户态与内核态之间的桥梁,当用户态进程发出I/O请求时,I/O管理器就捕获这些请求,将其转换为IRP请求,发送给驱动程序。I/O管理器无疑是非常重要的,具有核心地位。它负责所有I/O请求的调度和管理工作,根据请求的不同内容,选择相应的驱动程序对象,设备对象,并生成、发送、释放各种不同的IRP。整个I/O处理流程是在它的指挥下完成的。
      一个IRP是从非分页内存中分配的可变大小的结构,它包括两部分:IRP首部和辅助请求参数数组,如图1所示。这两部分都是由I/O管理器建立的。


图1 IRP简单结构图
      IRP首部中包含了指向IRP输入输出缓冲区指针、当前拥有IRP的驱动指针等。
紧接着首部的是一个IO_STACK_LOCATION结构的数组。它的大小由设备栈中的设备数确定(设备栈的概念会在下文中阐述)。IO_STACK_LOCATION结构中保存了一个I/O请求的参数及代码、请求当前对应的设备指针、完成函数指针(IoCompletion)等。
      那么,由I/O管理器产生的IRP请求发送到哪去了呢?这里我们就要来说说设备栈的概念了,操作系统用设备对象(device object)表示物理设备,每一个物理设备都有一个或多个设备对象与之相关联,设备对象提供了在设备上的所有操作。也有一些设备对象并不表示物理设备。一个唯软件驱动程序(software-only driver,处理I/O请求,但是不把这些请求传递给硬件)也必须创建表示它的操作的设备对象。设备常常由多个设备对象所表示,每一个设备对象对应一个驱动程序来管理设备的I/O请求。一个设备的所有设备对象被组织成一个设备栈(device stack)。而且,IO_STACK_LOCATION数组中的每个元素和设备栈中的每个设备是一一对应的,一般情况下,只允许层次结构中的每个设备对象访问它自己对应的IO_STACK_LOCATION。无论何时,一个请求操作都在一个设备上被完成,I/O管理器把IRP请求传递给设备栈中顶部设备的驱动程序(IRP是传递给设备对象的,通过设备对象的DriverObject成员找到驱动程序)。驱动程序访问它对应的设备对象在IRP中IO_STACK_LOCATION数组中的元素检查参数,以决定要进行什么操作(通过检查结构中的MajorFunction字段,确定执行什么操作及如何解释Parameters共用体字段的内容)。驱动程序可以根据IO_STACK_LOCATION结构中的MajorFunction字段进行处理。每一个驱动或者处理IRP,或者把它传递给设备栈中下一个设备对象的驱动程序。

传递IRP请求到底层设备的驱动程序需要经过下面几个步骤:
1.  为下一个IO_STACK_LOCATION结构设置参数。可以有以下两种方式:
  调用IoGetNextIrpStackLocation函数获得下个结构的指针,再对参数进行赋值;
  调用IoCopyCurrentIrpStackLocationToNext函数(如果第2步中驱动设置了IoCompletion函数),或者调用IoSkipCurrentIrpStackLocation函数(如果第2步中驱动没有设置IoCompletion函数)把当前的参数传递给下一个。
2.  如果需要的话,调用IoSetCompletionRoutine函数设置IoCompletion函数进行后续处理。
3.  调用IoCallDriver函数将IRP请求传递给下一层驱动。这个函数会自动调整IRP栈指针,并且执行下一层驱动的派遣函数。
当驱动程序把IRP请求传递给下一层驱动之后,它就不再拥有对该请求的访问权,强行访问会导致系统崩溃。如果驱动程序在传递完之后还想再访问该请求,就必须要设置IoCompletion函数。IRP请求可以再其他驱动程序或者其他线程中完成或取消。

当某一驱动程序调用IoCompleteRequest函数时,I/O操作就完成了。这个函数使得IRP的堆栈指针向上移动一个位置,如图2所示:


图2 IRP完成时栈指针的移动
图2所示的当C驱动程序调用完IoCompleteRequest函数后I/O栈的情况。左边的实线箭头表明栈指针现在指向驱动B的参数和回调函数;虚线箭头是之前的情况。右边的空心箭头指明了IoCompletion函数被调用的顺序。
如果驱动程序把IRP请求传递给设备栈中的下层设备之前设置了IoCompletion函数,当I/O栈指针再次指回到该驱动程序时,I/O管理器就将调用该IoCompletion函数。
IoCompletion函数的返回值有两种:
(1)STATUS_CONTINUE_COMPLETION:告诉I/O管理器继续执行上层驱动程序的IoCompletion函数。
(2)STATUS_MORE_PROCESSING_REQUIRED:告诉I/O管理器停止执行上层驱动程序,并将栈指针停在当前位置。在当前驱动程序调用IoCompleteRequest函数后再继续执行上层驱动的IoCompletion函数。
当所有驱动都完成了它们相应的子请求时,I/O请求就结束了。I/O管理器从Irp >IoStatus.Status中更新状态信息,从Irp >IoStatus.Information中获得传送字节数。

大概就是这样了,我也是刚学习Windows内核方面的知识,有什么理解不正确的地方,欢迎大家批评指正!另外,有些内容参考了一些英文资料,翻译上可能有不符合规范的,大家见谅!