Entering the kernel without a driver-无驱动进入内核态与通过APIC获得中断信息

标题：Entering the kernel without a driver-无驱动进入内核态与通过APIC获得中断信息
作者：zxjshk
时间：2011-04-18 23:50:07
链接：http://bbs.pediy.com/showthread.php?t=132597

《Entering the kernel without a driver and getting interrupt information from APIC》
                                                  ------Anton Bassov
《无驱动进入内核态与通过APIC获得中断信息》

先唠叨两句-----整理移动硬盘时，发现一篇两年前翻译了一半的文章....唉....很多烦心的事情涌了上来。比较老的一篇文章了，先贴上来，可能已经有朋友翻译过了，见谅....
                                              ------- SHK

第一部分：免驱动进入内核态

【简介】
    虽然让用户模式下的应用程序进入内核模式是激动人心的尝试，但实现方法却闻所未闻。第一个实现该想法的人是Matt Pietrek(多年以前在Windows 95环境下)。后来Prasad Dabak,Sandeep Phadke和Milind Borate在Windows NT下改进了他的技术。为了进入内核模式，不得不在全局描述符表(GDT)中创建中断门描述符，以便应用程序通过中断门进入内核模式。但是，用户模式下的代码是不允许访问GDT的，上述方法中使用了内核模式下的驱动来创建中断门描述符。当然，一个逻辑上的问题产生了 - 如果需要驱动来实现，那么无驱动进入内核态是指什么？？？二者自相矛盾，不是么？

    本文将描述用户态程序如何访问内核地址空间，以及不依靠驱动在GDT中创建中断门描述符。文章讲解了32位处理器上如何完成虚拟地址到物理地址的转换，以及用户态程序如何查找指定虚拟地址代表的物理地址。所有方法思路完全是我独立设计 - 你不可能在其它任何地方找到相似的文章。文章也说明了Windows NT如何保护内核地址空间，基于x86系统的特权级转换和无驱动进入内核态。

    补充一点，文中介绍了高级可编程中断控制器(APIC)以及如何通过它获取中断信息。该知识点在Windows界似乎并不为人所知，虽然Mark Russinovich 和David Solomon在《Windows Internals(第四版)》中简单提到了APIC。不管怎样，该书并没有说明怎样进行APIC编程。我在其它以Windows为主题的文章中也从未遇到关于APIC的介绍 - 我不得不根据Intel的参考手册来弄清这一切。因此，我相信这些内容能使Windows开发人员产生极大的兴趣。

    总而言之，如果你想学到更多关于系统内部的东西，本文正合你胃口。

【访问内核地址空间】
    假定我们想在用户模式下运行一个程序来访问内核空间的一些地址。这可能吗？可能，也不可能。若我们直接当作一个虚拟地址来访问，将引发非法访问(ACCESS  VIOLATION)异常。不过，可以换个思路 - 物理内存可以当作一个名为“\\Device\\PhysicalMemory”的区域用函数NtOpenSection()打开，然后通过内核API函数NtMapViewOfSection进行映射。通过该技术我们可以访问内存的任何页面。如果我们知道目标虚拟地址所代表的物理地址，工作将变得非常简单 - 只需要用NtMapViewOfSection()映射这块物理内存，函数返回的指针指向内核中目标地址对应相同的物理地址，但地址在数值上小于0x80000000。我们能够在用户模式下访问物理地址之后，若要写入数据，则映射前需要做些额外工作。问题就在于非系统级进程，进程若不是在用户态SYSTEM等级启动，就无法对“\\Device\\PhysicalMemory”进行写入访问。因此，你需要授予程序写入“\\Device\\PhysicalMemory”的权限。代码如下：

  EXPLICIT_ACCESS Access;
  PACL OldDacl=NULL, NewDacl=NULL;
  PVOID security;
  HANDLE Section;
  INIT_UNICODE_STRING(name,L"\\Device\\PhysicalMemory");
  OBJECT_ATTRIBUTES oa ={sizeof(oa),0,&name,0,0,0};

  memset(&Access, 0, sizeof(EXPLICIT_ACCESS));
  NtOpenSection(&Section, WRITE_DAC | READ_CONTROL, &oa);
  GetSecurityInfo(Section, SE_KERNEL_OBJECT, DACL_SECURITY_INFORMATION, NULL, NULL, &OldDacl,NULL, &security);

  Access.grfAccessPermissions = SECTION_ALL_ACCESS;
  Access.grfAccessMode        = GRANT_ACCESS;
  Access.grfInheritance       = NO_INHERITANCE;
  Access.Trustee.MultipleTrusteeOperation = NO_MULTIPLE_TRUSTEE;
  Access.Trustee.TrusteeForm  = TRUSTEE_IS_NAME;
  Access.Trustee.TrusteeType  = TRUSTEE_IS_USER;
  Access.Trustee.ptstrName = "CURRENT_USER";

  SetEntriesInAcl(1, &Access, OldDacl, &NewDacl);
  SetSecurityInfo(Section, SE_KERNEL_OBJECT, DACL_SECURITY_INFORMATION,NULL, NULL, NewDacl, NULL);
  CloseHandle(Section);

    为了让代码运行，你必须以Administrator身份登录系统。根据我的经验，受限用户无法打开“\\Device\\PhysicalMemory”进行任何访问 - 即使你请求对“\\Device\\PhysicalMemory”进行只读访问， NtOpenSection()也总是返回出错代码。

    因此，一旦我们拥有Administrator权限，就可以访问内存的任何页面，并且是在用户模式下 - 即使页面发生错误。换句话说，我们可以间接访问内核地址空间。你不觉得激动么？为了实用，我们还要找出目标地址在内核空间中对应的物理地址。内核模式的驱动程序可以调用MmGetPhysicalAddress()，但用户模式下绝对没机会使用这个函数。进一步说，用户态的API函数可能都毫无帮助。因此，只能依靠我们自己去弄清一切，这就是为什么我们首先要学会32位处理器下的虚拟-物理地址转换。

    在x86系统上页面大小可以是4KB或4MB。如果页面大小是4KB，32位虚拟地址包含3段CPU所需的信息，用于定位物理地址。虚拟地址的低12位表示在物理内存页面中偏移量。12至21位是页面表中项目的索引号，共有1024个物理页面入口。每个进程理论上最多有1024个页面表。那么，1024×1024×4096产生了4GB可编址空间。进程中所有页面表的地址存储在一个页面目录中。第22到31位用于在页面目录中查找合适的页面表。各个进程维护着自己的页面目录。当前进程页面目录的物理地址存放在CR3寄存器中。这个寄存器只在任务切换时被修改，所以不希望系统中其它任何东西来访问它。通过任务切换，系统在CR3载入不同的页面目录地址。因此，先前关联到物理页面X的虚拟地址现在可能仍然表示同一个页面X，也可能是其他页面Y，或者没有对应的物理页面。这就是为什么对于任何虚拟地址，在进程A中有效的地址空间可能在进程B中变得毫无意义，除非它们关联到同一个物理地址。驱动程序被一次性加载到内存中，并映射到所有进程的相同虚拟地址上，因此改变CR3的值不会对驱动有影响。

    每个页面目录和页面表入口用32位结构体描述如下：

  struct PageDirectoryOrTableEntry{
    DWORD Present:1;
    DWORD ReadWrite:1;
    DWORD UserSupervisor:1;
    DWORD WriteThrough:1;
    DWORD CacheDisabled:1;
    DWORD Accessed:1;
    DWORD Reserved:1;
    DWORD Size:1;
    DWORD Global:1;
    DWORD Unused:3;
    DWORD PhysicalAddress:20;
  };

    如果页面大小是4KB，地址转换方式如下：
    1.CPU从CR3寄存器获取当前进程的页面目录。虚拟地址的高10位表示为索引号(i)，CPU用它来查找给定虚拟地址在该页面目录中对应的页面表的入口地址。若页面目录中第i个入口的Present标志没有设置(为1)，CPU将产生一个页面错误异常(INT 0xE)。导致页面错误的原因很多，比如无效地址、向只读单元写入数据等等。因此，系统首先检查页面错误的原因。若这个异常仅仅是由于Present标志未设置造成的，系统就会得知存在问题的页面已经交换到了磁盘上。那么，它会将该页面装载到内存，并设置相应页面目录入口的Present标志，CPU也会再次尝试访问该虚拟地址。以上所有操作对用户代码来说是不可见的。
    2.确定页面表之后，CPU在该表中进一步查找指定虚拟地址对应的页面位置。第12至21位表示为索引号(i)，CPU用它来确定页面中目标页面的地址。如果页面表中第i个入口的Present标志未设置，CPU将产生一个页面错误异常，系统按照前面提到的方式处理。
    3.最后，已经确定了目标页面，CPU就是用虚拟地址的低12位作为页面内的偏移地址。

    这就是4KB页面大小的地址转换过程。如果页面为4MB，则地址的高10位表示页面目录中页面的索引号，剩余22位表示该页面内的偏移量(1024*4MB的偏移量，4GB的可编址空间)。

    64位处理器采用更高级的地址变换方式。例如，Itanium处理器允许所谓的硬件级的数据执行保护(DEP)。很多人误以为DEP是Windows XP SP2的功能。并非如此 - DEP是CPU的功能，可以被Windows XP SP2利用。如果Windows XP SP2运行在一个不支持DEP的CPU上，DEP就不会发挥作用 - 在没有DEP功能的处理器上，没有办法去手动阻止机器指令的执行。我们的讨论是基于32位处理器和4KB页面大小进行的。

    在Windows NT下，当前进程的页面目录被映射到虚拟地址0xC0300000。结合我们已知的地址转换知识，得出以下两条结论：

    1.在Windows NT中，页面目录的第0x300个入口保存着页面目录自己的物理地址。
    2.虚拟地址对应的页面表可以按表达式0xC0000000+((address>>10)&0x3FF000)来访问。通过这种转换，可以发现页面表地址0xC0300000就是0xC0300000本身。换而言之，页面目录本身也位于页面目录的虚拟地址对应的页面表中。

    现在，我们来实战一下。试想如下内核模式的代码：

  _asm{
    mov ebx,0xfec00000
        or ebx, 0x13
    mov eax,0xc0000000
    mov dword ptr[eax],ebx
  }//我们想干什么???难道疯了吗???
  PULONG array=NULL;
  array[0]=1;

    运行这段代码将发生什么？答案似乎显而易见，但那是错的 - 程序并不会崩溃。我们对单元0xfec00013进行写操作(高20位指明内存页面0xfec00，低12位设置了Present、ReadWrite和CacheDisabled标志)，它正是第一个页面表的入口，该地址存放在页面目录的第一个入口中。下面看看CPU如何转换虚拟地址0，你将会明白，由于我们的修改，0会被转换为物理地址0xfec00000。从现在起，虚拟地址范围0到0x1000变成进程地址空间内的一个有效范围。NULL指针生效，并指向物理地址0xfec00000!!!很有趣，对吧？稍后你会明白这个技巧在某些情况下相当有用。

    言归正传 - 你可能还记得，我们当前的任务是找到目标虚拟地址所代表的物理地址。更重要的是，在用户模式下完成这项工作。如果已经知道物理内存中进程的页面目录的地址，我们的工作就不值一提了。假设目标虚拟地址是V。通过NtMapViewOfSection()函数映射页面目录到虚拟地址D，把D看作是由1024个DWORD类型数据组成的数组。D中第(V>>22)个入口数据的高20位描述的物理页面就是一个页面表，与虚拟地址V相对应。所以，我们将映射该页面到虚拟地址T，再次将其看作一个包含1024个DWORD元素的数组 - T中第((V>>12)&0x3FF)个入口数据的高20位对应着虚拟地址V所表示的物理页面。这样描述非常简洁。只有一个问题 - CR3寄存器，通过它才能使我们进程的页面目录的物理地址有效，却无法在用户模式下访问。那么，首先我们必须要找到进程页面目录所在的物理地址。

    我们将要做一次内存扫描，把每个内存页面映射到进程的地址空间，那样做迟早会找到进程的页面目录。但怎样识别它呢？假定我们检查的物理页面是P，通过NtMapViewOfSection()映射到虚拟地址V。V是包含1024个DWORD元素的数组。若P是包含进程页面目录的物理页面，那么：

    1.V中第0x300个入口数据的高20位一定等于P，因为页面目录的第0x300个入口数据保存了目录自身的物理地址。
    2.V中第0x300个入口数据的最低位一定被置1，因为它表明了内存中页面的存在。
    3.若P是一个页面目录，则V中第(V>>22)个入口数据描述了一个页面表，它对应于虚拟地址V自身，并且该页面表已载入内存。因此，V中第(V>>22)个入口数据最低位一定被置为1。

    若不满足以上任意一条，我们就可以断定P不是页面目录，那么接着扫描下一个页面。否则，就映射V中第(V>>22)个入口数据高20位所描述的页面(把这个虚拟地址叫做T吧)，并假定T是对应于虚拟地址V的一张页面表。若假设成立，则：

    1.T中第((V>>12)&0x3FF)个入口数据的高20位一定等于P。
    2.T中第((V>>12)&0x3FF)个入口数据的最低位一定被置1。

    满足以上两个条件，就可以认为P确实是页面目录，所以它可以通过虚拟地址V来访问。我们凭什么相信这个结论？再看看虚拟-物理地址转换的相关内容，仔细想想V到物理地址P的转换，然后，我希望你将会理解这一切。参看以下代码：

  //检查以下我们获得了多少内存
  MEMORYSTATUS meminfo;
  GlobalMemoryStatus(&meminfo);

  //获取内存句柄
  status = NtOpenSection(&Section, SECTION_MAP_READ|SECTION_MAP_WRITE, &oa);
  DWORD found=0,MappedSize,x;
  LARGE_INTEGER phys;
  DWORD* entry;
  PVOID DirectoryMappedAddress,TableMappedAddress;
  DWORD DirectoryOffset,TableOffset;

  for(x=0;x<meminfo.dwTotalPhys;x+=0x1000){
    //映射内存中的当前页面
    MappedSize = 4096;
    phys.QuadPart = x;
    DirectoryMappedAddress = 0;
    status = NtMapViewOfSection(Section, (HANDLE) -1, &DirectoryMappedAddress, 0L, MappedSize, &phys, &MappedSize, ViewShare, 0, PAGE_READONLY);
    if(status)
      continue;
    entry = (DWORD*)DirectoryMappedAddress;

    //获取偏移量
    DirectoryOffset = (DWORD)DirectoryMappedAddress;
    TableOffset = (DWORD)DirectoryMappedAddress;
    DirectoryOffset>>=22;
    TableOffset = (TableOffset>>12)&0x3ff;

    //检查该页面是否为页面目录
    //第0x300个入口数据的高20位一定等于P
    //并且第0x300个入口和第(V>>22)个入口的数据Present位一定被设置1
    //不满足就扫描下一个页面
    if((entry[0x300]&0xfffff000)!=x ||(entry[0x300]&1)!=1 || (entry[DirectoryOffset]&1)!=1){
      NtUnmapViewOfSection((HANDLE) -1, DirectoryMappedAddress);
      continue;
    }

    //看样子差不多了
    //接下来试着映射一下页面表
    MappedSize = 4096;
    phys.QuadPart = (entry[DirectoryOffset]&0xfffff000);
    TableMappedAddress = 0;
    status = NtMapViewOfSection(Section, (HANDLE) -1, &TableMappedAddress, 0L,MappedSize, &phys, &MappedSize, ViewShare, 0, PAGE_READONLY);
    if(status){
      NtUnmapViewOfSection((HANDLE) -1, DirectoryMappedAddress);
      continue;
    }

    //现在来检查它是否是一个真正的页面表
    //如果是，第((V>>12)&0x3ff)个入口数据的高20位一定等于P
    //并且该入口的Present位一定被设置为1
    //上述为真，则P确实是一个页面目录
    entry = (DWORD*)TableMappedAddress;
    if((entry[TableOffset]&1)==1 && (entry[TableOffset]&0xfffff000)==x)
      found++;
    NtUnmapViewOfSection((HANDLE) -1, TableMappedAddress);

    //目录找到了 - 没必要继续扫描下去
    if(found)
      break;
    NtUnmapViewOfSection((HANDLE) -1, DirectoryMappedAddress);
  }

    这段代码可信么？会不会误判了一些页面为页面目录？这种错误要用42个随机位同时发生来表示。因此，发生该错误的概率为2的42次方分之一，也就是说，实践中可以忽略不计。那么会不会丢掉了某些页面目录？我们进行连续扫描可以保证找到它，除非页面目录在代码运行时被移走了。理论上而言，内存管理器可能会移动物理内存中包括页面目录在内的任何页面，但这只发生在页面故障时 - 某些页面被交换到磁盘，之后又加载到内存的其它位置。一旦频繁交换访问页面到磁盘导致性能显著降低，系统就不再频繁交换访问中的页面。在页面目录交换到磁盘之前，进程不得不暂停一段时间 - 代码运行时，页面目录正在被执行中的指令访问，所以它不可能成为分页内存。因而我们可以放心地推测代码执行过程中，页面目录位于内存中某个固定的地址上。也就是说，我们的方法在实践中是非常可靠的 - 我用过很多、很多、很多次了，屡试不爽(!!!)。

    现在，一旦我们知道页面目录的物理地址，就可以轻松获取任何我们感兴趣的虚拟地址所对应的物理地址 - 解决“方案”前面已叙述过。下面我们来获取保存了全局描述符表(GDT)的页面的物理地址。

  //获取GDT的基地址
  BYTE gdtr[8];
  DWORD gdtbase,physgdtbase;
  _asm{
    sgdt gdtr
    lea eax,gdtr
    mov ebx,dword ptr[eax+2]
    mov gdtbase,ebx
  }

  //获取目录和表的偏移量
  DirectoryOffset = gdtbase;
  TableOffset = gdtbase;
  DirectoryOffset>>=22;
  TableOffset = (TableOffset>>12)&0x3ff;
  entry = (DWORD*)DirectoryMappedAddress;

  //映射页面表 - 物理地址是页面目录中第(V>>22)个入口数据的高20位
  MappedSize = 4096;
  phys.QuadPart = (entry[DirectoryOffset]&0xfffff000);
  TableMappedAddress = 0;
  status = NtMapViewOfSection(Section, (HANDLE) -1, &TableMappedAddress, 0L, MappedSize, &phys, &MappedSize, ViewShare, 0, PAGE_READONLY);

  //物理页面是页面表中第((V>>12)&0x3ff)个入口数据的高20位
  //这就是我们需要的
  entry = (DWORD*)TableMappedAddress;
  physgdtbase = (entry[TableOffset]&0xfffff000);

  //取消一切映射
  NtUnmapViewOfSection((HANDLE) -1, TableMappedAddress);
  NtUnmapViewOfSection((HANDLE) -1, DirectoryMappedAddress);

    GDT在用户模式下不可访问，但是，如前所说，这个限制对我们不再有效 - 我们已经找到了页面所在的物理地址，对不？为了访问GDT，首先要利用NtMapViewOfSection()映射这个页面到虚拟地址。

    GDT不一定位于页面的起始处，所以我们要使用它虚拟地址的低12位作为页面内的偏移量。因此，要给V加上(gdtbase&0xFFF)。至此我们可以在虚拟地址V中读写GDT。那么，我们就能在用户态程序中对内核地址空间进行读写访问。若还能执行代码岂不更好？这就是我们所期待的事情，也就是前面一系列讲解的目的，也就是我们为何要在内核地址空间中得到GDT的物理地址而不是其它地址的原因 - GDT有助于我们的程序在不依靠驱动的情况下进入内核模式。

【代码特权级和保护属性】
    GDT中保存了段描述符、局部描述符表(LDT)描述符、中断门描述符和任务状态段(TSS)描述符。虽然各自结构不同，但所有这些描述符大小都是8字节。段描述符和中断门描述符的构成用以下8字节结构体表示：

  struct  SegmentDescriptor{
    WORD LimitLow;
    WORD BaseLow;
    DWORD BaseMid : 8;
    DWORD Type : 5;
    DWORD Dpl : 2;
    DWORD Pres : 1;
    DWORD LimitHi : 4;
    DWORD Sys : 1;
    DWORD Reserved_0 : 1;
    DWORD Default_Big : 1;
    DWORD Granularity : 1;
    DWORD BaseHi : 8;
  };

  struct CallGateDescriptor{
    WORD offset_low;
    WORD selector;
    BYTE param_count : 5;
    BYTE   unused : 3;
    BYTE  type : 5;
    BYTE  dpl : 2;
    BYTE present : 1;
    WORD offset_high;
  };

    Windows NT中不使用LDT和中断门。尽管考虑到性能的因素，Windows NT下所有用户进程运行在一个单任务的环境中，GDT中没有TSS描述符。它们主要被保留用来做“异常环境”，也就是系统崩溃 - 它们的任务是确保CPU重启前系统有足够长的时间运行来抛出一个蓝屏。我们对它们不感兴趣。那段描述符如何？你可能会认为，一旦Windows使用平坦内存模式，我们就不必关心段描述符。

    实际上，事情没那么简单。Windows平坦内存模式的实现是通过设置GDT中代码、数据、堆栈和附加段描述符的BaseLow、BaseMid和BaseHi域值为0，所以内存编址时不需要指明段基址和偏移量。可是，段仍然隐藏在幕后，因为在基于x86的机器上不使用段分割，就无法实现保护模式下运行的系统。严格地讲，问题在于x86系统中不存在内核或用户操作模式这类概念。相反，执行特权级指令和访问超级权限页面的功能是受代码段描述符中的描述符特权级(DPL)域控制的。因此，为了区分特权级代码和非特权级代码，需要两个代码段 - 特权级代码段DPL=0，非特权级代码DPL=3。尽管它们可能被映射到同一虚拟地址0中，但处理器会将它们区别对待。CS寄存器用于存放距离当前运行的代码段描述符表头的偏移字节数，与该代码段的DPL进行或运算。这就是CPU如何知道当前代码特权级的方法。在Windows NT中，CS寄存器的值可以为0x8(执行特权级代码时)或0x1B(执行非特权级代码时)。

    所以，特权级定义在CS寄存器中比定义在代码地址中更好。如果某个函数在执行时CS等于0x8，它就是特权级代码；但同一函数在CS等于0x1B时执行，它就是非特权级代码。我知道你的疑惑 - 毕竟非特权级代码没有机会访问0x80000000以上的地址单元。那不就有些矛盾么？不要紧，再看看PageDirectoryOrTableEntry结构体，注意UserSupervisor标志位，问题就迎刃而解 - Windows只是把映射到0x80000000以上地址的页面在页面表中标记为仅限超级权限访问。非特权级代码尝试访问这些页面，就会发生非法访问异常。任何位于该页面的函数不能在CS等于0x1B时运行 - 否则直接给出非法访问异常。因此，内核地址空间的保护是通过带页面权限保护的组合段分割方式来实现的。

    代码段从非特权级转变到特权级可以用下列方式实现：

    1.通过INT n指令 - 该指令将用户模式下的SS寄存器、用户模式下的ESP寄存器、EFLAGS寄存器、用户模式下的CS寄存器和返回地址(按该顺序压栈)压入内核栈，并转移控制权到INT n中断处理。Windows NT将中断描述符表入口的DPL位设置为用户态代码只允许在中断0x3、0x4、0x2A、0x2B、0x2C、0x2D和0x2E中执行。
    2.SYSENTER指令 - 该指令会设置调用线程的ESP为特殊寄存器SYSENTER_ESP_MSR结构所指定的值，设置CS为特殊寄存器SYSENTER_CS_MSR结构所指定的值，并转移执行到特殊寄存器SYSENTER_EIP_MSR结构所指定的地址处(用户模式下不能访问这些寄存器)。标志位和返回地址不会被保存。Windows NT/2000不使用SYSENTER指令，Windows XP下该指令转移执行到系统服务分配器中。
    3.通过中断门进行远调用 - 当通过中断门设定内核入口时，CPU从用户栈中复制大约32个(实际数目由中断门描述符的param_count域指定)DWORD单元到内核栈，接着将用户模式的CS寄存器值和返回地址压入内核栈，然后设置CS为中断门描述符selector域所指定的值，最后转移到中断门描述符offset_low和offset_high域所指定的地址处执行代码。Windows不使用中断门。

    前两个方式用于Windows中，它们转移执行到一些系统定义的地址处。因此，我们不能使用它们来转移执行到我们想要的任意一个地址。中断门与之不同 - 一旦Windows不使用它，我们就可以随心所欲地操作中断门。如果在GDT中设置一个中断门，我们就可以将代码执行权转移到中断门描述符中指定的任意地址。当然这个地址必须在我们进程地址空间中有效，不过不必位于内核地址空间中。特权级代码可以访问进程空间中的任何有效地址，另外你应当明白，代码的权限定义在CS中，而不是寄存器EIP中。所以，如果我们通过程序在中断门描述符中指定了函数的入口地址，那么通过中断门调用该函数，它就会被CPU当作特权级代码，即使它位于进程的用户地址空间中。接下来这个函数可以访问任何内存地址、IO端口、产生中断、调用ntoskrnl.exe中的导出函数，也就是说，几乎可以完成一切内核模式驱动程序才能做的事情。与此同时，该函数不应去尝试调用用户模式下DLL中的API函数。为什么呢？因为这些API函数可能调用了内核API，并且内核API函数动用了系统服务，换句话说，通过系统服务分配器进入内核 - 在我们已经处于特权级模式下的时候！！！这不会给我们带来任何好处。一个基本原则是Windows对我们的手法了解越少，对我们就越有利。那我们怎样返回用户模式呢？可以用IRETD、SYSEXIT或RETF指令实现。虽然返回的方式和调用的方式本应该匹配，但这也不是绝对的。例如，在Windows XP下，从INT 0x2B中断处理程序返回用的是SYSEXIT，并非IRETD指令 - 只要进入中断程序和中断返回二者能很好地平衡内核和用户栈，就万事OK。显然，在我们讨论的情况下，RETF指令是离开内核模式最合理的方法，所以我们利用RETF来回到用户模式。

【在GDT中设置中断门】
    现在万事俱备，可以通过我们的程序在GDT中设置中断门并进入内核模式了。请看下列代码：

  //先映射GDT
  PBYTE GdtMappedAddress = 0;
  phys.QuadPart = physgdtbase;
  MappedSize = 4096;
  NtMapViewOfSection(Section, (HANDLE) -1,(PVOID*)&GdtMappedAddress, 0L, MappedSize, &phys, &MappedSize, ViewShare, 0, PAGE_READWRITE);
  gdtbase& = 0xfff;
  GdtMappedAddress += gdtbase;
  CallGateDescriptor * gate = (CallGateDescriptor * )GdtMappedAddress;

  //在GDT中找一个没有被占用的入口.
  //当前GDT入口的类型无关紧要 - 所有类型的描述符第48位都是Present位，
  //所以我们把全部描述符都当作中断门
  selector = 1;
  while(1){
    if(!gate[selector].present)  break;
    selector++;
  }

  //设置一个中断门
  gate[selector].offset_low  = (WORD)((DWORD)kernelfunction & 0xFFFF);
  gate[selector].selector = 8;

  //将要传递一个参数
  gate[selector].param_count  = 1;
  gate[selector].unused = 0;

  //32位中断门
  gate[selector].type = 0xc;
  //一定是3
  gate[selector].dpl = 3;
  gate[selector].present = 1;
  gate[selector].offset_high = (WORD)((DWORD)kernelfunction >> 16);

  //不再需要物理内存
  NtUnmapViewOfSection((HANDLE) -1, GdtMappedAddress);
  CloseHandle(Section);

    首先，我们按照前面所说的方法映射GDT，并查找一个未被使用入口。GDT中所有描述符长度为8字节，第48位表示Present位。这对任何类型的描述符都是一样。因此，当我们查找空闲的入口时，可以将所有GDT入口当作中断门描述符，忽略它们的实际类型。找到入口之后，设置一个中断门描述符。我们把它的类型设为0xC来描述32位中断门，它的DPL为3，也就是可以在用户模式下被访问。它的Selector域为0x8，offset_low和offset_high域分别为中断调用的函数的低16位和高16位地址。参数怎么办？通过指定param_count域？我想是这样，本文所涉及的行为都是非常规的，可以很好地利用它使我们的内核代码做些鲜为人知的事情。有一篇关于代码工程的文章讲述了如何从注册表中获得中断信息。我也将把这一切展示给你，当然，是通过更激动人心的方法，而不是靠解释中断源代码或搜索注册表来得到中断信息。因此，我们将传递IRQ作为函数的参数，而函数将返回这个特殊的IRQ所对应的中断向量。

【高级可编程中断控制器】
    系统如何映射IRQs到中断向量并定义它们的优先级？这取决于你的机器是否支持高级可编程中断控制器（APIC）。这个可以通过CPUID指令，然后从指定寄存器 - APIC_BASE_MSR结构读取信息来知道。