端口访问监控原理

标题：端口访问监控原理
作者：NetRoc
时间：2008-06-02 17:48
链接：http://bbs.pediy.com/showthread.php?t=65903

NetRoc
http://netroc682.spaces.live.com/
本来不打算写文章的，呵呵。既然AhnLab敢用，我当然也敢写咯，哈哈
安博士的反外挂系统最近添加了一个功能，可以检查出来按键精灵、简单游这些用增强版WinIo直接进行端口读写的程序。后来拿来看了一下，其原理就是自己前段时间实现过的那种。通过Hook int 1，设置IO断点进行监控的方法。
原理如下：
Intel兼容CPU都内置了调试功能。可以设置的断点类型包括执行断点、内存访问断点和IO断点。通过操作DrX寄存器和CR4 寄存器，可以在发生特定端口的读写操作时触发断点。AhnLab的这种检测技术就是基于CPU的这种功能。以下的介绍都基于32位处理器。
CPU调试寄存器简介：
DR0DR3寄存器：它们是32位调试地址寄存器。根据DR7中设置的不同，它们可以包含内存地址，也可以包含IO端口号。很多调试器的硬件断点也是通过这几个寄存器实现的，所以一般硬件断点只能设置4个。
DR4和DR5：这两个寄存器是被系统保留的，当CR4中的DE被设置时，访问这两个寄存器会产生非法指令错误#UD；当CR4中的DE被清空时，这两个寄存器和DR6、DR7关联，即访问它们和访问DR6、DR7一样。
DR6：调试状态寄存器。这个寄存器用于在调试事件发生时报告状态信息。要判断是哪个断点被触发，触发的原因之类的就是靠它里面的值。DR6的定义如下：
  typedef struct _DR6INFO
{
  unsigned B0  :  1;  //B0
  unsigned B1  :  1;  //B1
  unsigned B2  :  1;  //B2
  unsigned B3  :  1;  //B3
  unsigned Reserved1  :  9;  //reserved
  unsigned BD  :  1;  //BD
  unsigned BS  :  1;  //BS
  unsigned BT  :  1;  //BT
  unsigned Reserved2  :  16;  //Reserved
}DR6INFO, *PDR6INFO;
  B0到B3用于指示哪个断点被触发。它们分别对应于DR0到DR3中的地址或端口。
  BD表示触发断点的下一条指令是对调试寄存器的访问。当DR7的GD标志被设置时，对调试寄存器进行访问的指令会触发调试事件，并且DR6的BD被设置。
  BS表示是由于单步执行触发的调试事件。当EFLAGS的TF标志被设置时，这种断点会被触发。
  BT指示是由于任务切换触发的调试事件。当TSS中的T标志被设置时会产生这种事件。
DR7：调试控制寄存器。对断点是否启用、断点类型等的控制。设置断点需要配合DR0DR3和DR7寄存器。定义如下：
typedef struct _DR7INFO
{
  unsigned L0  :  1;  //L0
  unsigned G0  :  1;  //G0
  unsigned L1  :  1;  //L1
  unsigned G1  :  1;  //G1
  unsigned L2  :  1;  //L2
  unsigned G2  :  1;  //G2
  unsigned L3  :  1;  //L3
  unsigned G3  :  1;  //G3
  unsigned LE  :  1;  //LE
  unsigned GE  :  1;  //GE
  unsigned Reserved1  :  3;  //reserved
  unsigned GD  :  1;  //GD
  unsigned Reserved2  :  2;  //reserved
  unsigned RW0  :  2;  //R/W0
  unsigned LEN0  :  2;  //LEN0
  unsigned RW1  :  2;  //R/W1
  unsigned LEN1  :  2;  //LEN1
  unsigned RW2  :  2;  //R/W2
  unsigned LEN2  :  2;  //LEN2
  unsigned RW3  :  2;  //R/W3
  unsigned LEN3  :  2;  //LEN3
}DR7INFO, *PDR7INFO;
  L0到L3：设置时为当前任务启用相应的断点条件。每次任务切换时CPU都会自动清除Lx位，所以这几位只控制当前任务的断点。
  G0到G3：为所有任务启用相应的断点条件。这是针对整个机器的。
  LE和GE：P6 family和之后的IA32处理器都不支持这两位。当设置时，使得处理器会检测触发数据断点的精确的指令。为了兼容性，Intel建议使用精确断点时把LE和GE都设置为1。
  GD：设置GD位时启用对调试寄存器的保护，这时对这些寄存器的访问都会触发调试中断。进入中断处理函数前，CPU会清掉GD位，使得中断处理函数能够访问DRx寄存器。
  R/W0到R/W3：指定各个断点的触发条件。它们对应于DR0到DR3中的地址以及DR6中的4个断点条件标志。这几位的意义会受到CR4中的DE位的影响。
当DE位为1时，它们的意义如下：
00  仅在指令执行时中断
01  仅数据写入时中断
10  IO输入输出时中断
11  数据读取或写入时中断，但是不受指令预取的影响
当DE位为0时，它们的意义如下：
00  仅在指令执行时中断
01  仅数据写入时中断
10 未定义
11  数据读取或写入时中断，但是不受指令预取的影响
  LEN0到LEN3：指定在调试地址寄存器DR0到DR3中指定的地址位置的大小。如果R/Wx位为0，则LENx位也必须为0，否则会产生不确定的行为。这几位的意义如下：
00  1字节长度
01  2字节长度
10  未定义
11  四字节长度
IO监控的实现
介绍了上面这些内容，那么IO监控的实现方法就很简单了，键盘IO的端口是60和64，比如要监控60端口，就可以这样进行：
  Hook掉Trap01，自己接管调试中断
  设置CR4的DE，以及DR7中的LE和GE。
  在DR0到DR3中选一个来设置端口号，比如选择DR0设置为0x60。
  设置DR7中的R/Wx和LENx位，这里应该设置RW0为10、LEN0为00
  在Hook的中端函数中，检查DR6中的B0到B3，如果是B0的话，表明发生了对0x60端口的读写操作。
由于IO断点是Trap，即在事件发生后才能触发中断，所以这种方法不能阻止对端口的读写，而仅能够进行监控。判断读写的数据以及要精确的判断是读还是写需要更进一步的操作，也是有一些办法可以实现的，这里就不说完了，呵呵。
实现的关键代码

代码:

Hook掉IDT
NTSTATUS HookIdt(ULONG ulId, PVOID pIntProc, PULONG pOldIntProc, PIDTENTRY pstOldEntry)
{
  CCHAR CpuCount = 0;
  PIDTENTRY    IdtEntry = NULL;
  IDTR stIdtr = {0};

  CpuCount = *KeNumberProcessors;
  while( CpuCount > 0)
  {//处理多CPU
    KeSetAffinityThread( KeGetCurrentThread(), CpuCount);//绑定CPU
    //得到IDTR 中得段界限与基地址
    _asm sidt stIdtr;
    IdtEntry = (PIDTENTRY)stIdtr.Base;
    //保存原有得IDT
    if ( pstOldEntry)
    {
      RtlCopyMemory( pstOldEntry, &IdtEntry[ulId], sizeof( IDTENTRY));
    }
    _asm cli;//禁止中断
    if ( pOldIntProc)
    {
      *pOldIntProc = (ULONG)IdtEntry[ulId].OffsetLow | ((ULONG)IdtEntry[ulId].OffsetHigh<<16);    
    }
    IdtEntry[ulId].OffsetLow   = (unsigned short)pIntProc;                           
    IdtEntry[ulId].OffsetHigh  = (unsigned short)((unsigned int)pIntProc>>16);
    _asm sti;//开中断
    CpuCount--;
  }
  return STATUS_SUCCESS;
}

//卸载钩子
NTSTATUS UnhookIdt(ULONG ulId, ULONG pIntProc)
{
  CCHAR CpuCount = 0;
  PIDTENTRY    IdtEntry = NULL;
  IDTR stIdtr = {0};
  CpuCount = *KeNumberProcessors;
  while( CpuCount > 0)
  {
    KeSetAffinityThread( KeGetCurrentThread(), CpuCount);//绑定CPU
    //得到IDTR 中得段界限与基地址
    _asm sidt stIdtr;
    IdtEntry = (PIDTENTRY)stIdtr.Base;
    _asm cli;//禁止中断  
    IdtEntry[ulId].OffsetLow   = (unsigned short)pIntProc;                           
    IdtEntry[ulId].OffsetHigh  = (unsigned short)((unsigned int)pIntProc>>16);
    _asm sti;//开中断
    CpuCount--;
  }
  return STATUS_SUCCESS;
}

//自己的
#pragma optimize( "", off )
void __declspec (naked) NewTrap01(void)
{
  INT_CONTEXT stContext;
  ULONG ulResult;
  _asm
  {    
    //保存环境;
    push ebp;
    mov ebp, esp;
    sub esp, 100h;

    mov stContext.cs, cs;
    mov stContext.ds, ds;
    mov stContext.eax, eax;
    mov stContext.ebp, ebp;
    mov stContext.ebx, ebx;
    mov stContext.ecx, ecx;
    mov stContext.edi, edi;
    mov stContext.edx, edx;
    mov stContext.es, es;
    mov stContext.esi, esi;
    mov stContext.esp, esp;
    mov stContext.fs, fs;
    mov stContext.ss, ss;
    mov ax, 0x30;
    mov fs, ax;
    mov stContext.gs, gs;
  }
  ulResult = OnTrap01( &stContext);//实际处理
  if ( ulResult == 1)
  {
    _asm
    {    
      mov ax, stContext.ds;
      mov ds, ax;
      mov ebp, stContext.ebp;
      mov ebx, stContext.ebx;
      mov ecx, stContext.ecx;
      mov edi, stContext.edi;
      mov edx, stContext.edx;
      mov esi, stContext.esi;

      mov ax, stContext.es
      mov es, ax;
      mov ax, stContext.fs
      mov fs, ax;
      mov ax, stContext.ss
      mov ss, ax;
      mov ax, stContext.gs;
      mov gs, ax;
      mov eax, stContext.eax;

      mov esp,ebp;
      pop ebp;
      //退出
      iretd;
    }
  }
  else
  {
    _asm
    {    
      mov ax, stContext.ds;
      mov ds, ax;
      mov ebp, stContext.ebp;
      mov ebx, stContext.ebx;
      mov ecx, stContext.ecx;
      mov edi, stContext.edi;
      mov edx, stContext.edx;
      mov esi, stContext.esi;

      mov ax, stContext.es
      mov es, ax;
      mov ax, stContext.fs
      mov fs, ax;
      mov ax, stContext.ss
      mov ss, ax;
      mov ax, stContext.gs;
      mov gs, ax;
      mov eax, stContext.eax;

      mov esp,ebp;
      pop ebp;
      //不是自己需要的事件，调用原来的Trap01;
      jmp g_pOldTrap01;
    }
  }
  
}
#pragma optimize( "", on )

ULONG __stdcall OnTrap01(LPINT_CONTEXT pstContext)
{
  DR6INFO stDr6;
  ULONG ulEip = 0;
  USHORT usCs = 0;
  PUCHAR pucCode = 0;

  ulEip = *((PULONG)(pstContext->ebp + 4));
  usCs = *((PUSHORT)(pstContext->ebp + 8));
  /*DbgPrint( "[ebp]=0x%X, [ebp+4]=0x%X, [ebp+8]=0x%X, [ebp+C]=0x%X\r\n", *((PULONG)(pstContext->ebp)), 
    *((PULONG)(pstContext->ebp + 0x4)), 
    *((PULONG)(pstContext->ebp + 0x8)),
    *((PULONG)(pstContext->ebp + 0xC)));*/
  pucCode = (PUCHAR)ulEip;


  stDr6 = GetDR6();
  /*DbgPrint( "%d:In trap 01.dr6.B0=%d, dr6.B1=%d, dr6.B2=%d,dr6.B3=%d, dr6.BD=%d, dr6.BS=%d, dr6.BT=%d\r\n", __LINE__, 
    stDr6.B0, stDr6.B1, stDr6.B2, stDr6.B3, stDr6.BD, stDr6.BS, stDr6.BT);
  DbgPrint( "%d:Traped EIP=0x%X, CS=0x%X\r\n",  __LINE__, (ULONG)ulEip, (ULONG)usCs);*/
  if ( stDr6.B0 && g_bpInfo[0].blIsSet)
  {
    //
    OnBreak( 0, pstContext, pucCode);
    //DbgPrint("On bp 0\r\n");
    return 1;
  }else if ( stDr6.B1 && g_bpInfo[1].blIsSet)
  {
    //
    OnBreak( 1, pstContext, pucCode);
    //DbgPrint("On bp 1\r\n");
    return 1;
  }else if ( stDr6.B2 && g_bpInfo[2].blIsSet)
  {
    //
    OnBreak( 2, pstContext, pucCode);
    //DbgPrint("On bp 2\r\n");
    return 1;
  }else if ( stDr6.B3 && g_bpInfo[3].blIsSet)
  {
    //
    OnBreak( 3, pstContext, pucCode);
    //DbgPrint("On bp 3\r\n");
    return 1;
  }
  else
  {
    return 0;
  }
}

破解方法
既然知道了原理，那么破解方法也就很明了了。读写端口之前想办法清掉调试寄存器即可。但是如果处理了DR7中的GD标志的话，清调试器的办法要麻烦一些。这里也不赘述了，呵呵。