PE文件学习笔记(五):导入表、IAT、绑定导入表解析

1、导入表(Import Descriptor)结构解析:

导入表是记录PE文件中用到的动态连接库的集合,一个dll库在导入表中占用一个元素信息的位置,这个元素描述了该导入dll的具体信息。如dll的最新修改时间、dll中函数的名字/序号、dll加载后的函数地址等。而一个元素即一个结构体,一个导入表即该结构体的数组,其结构体如下所示:

typedef struct _IMAGE_IMPORT_DESCRIPTOR {
    union {
        DWORD   Characteristics;            //导入表结束标志
        DWORD   OriginalFirstThunk;         //RVA指向一个结构体数组(INT表)
    };
    DWORD   TimeDateStamp;                  //时间戳
    DWORD   ForwarderChain;                 // -1 if no forwarders
    DWORD   Name;                           //RVA指向dll名字,以0结尾
    DWORD   FirstThunk;                     //RVA指向一个结构体数组(IAT表)
} IMAGE_IMPORT_DESCRIPTOR, *PIMAGE_IMPORT_DESCRIPTOR;

在程序加载以前,其具体成员的结构关系如下所示:
PE文件学习笔记(五):导入表、IAT、绑定导入表解析_第1张图片
导入表结构体数组的第一个元素保存了KERNEL32.dll的信息,我们解析并打印其部分信息如下所示:

Name:KERNEL32.dll】 【NameAddr:0003487C】 【OriginalFirstThunk:00034028】   【FirstThunk:000341B4】   【TimeDateStamp:00000000ThunkOffset     ThunkValue      Hint        API Name
        [00034340]      [00034340]      [00CA]      [GetCommandLineA]
        [00034352]      [00034352]      [0174]      [GetVersion]
        [00034360]      [00034360]      [007D]      [ExitProcess]
        [0003436E]      [0003436E]      [029E]      [TerminateProcess]
        [00034382]      [00034382]      [00F7]      [GetCurrentProcess]
        [00034396]      [00034396]      [00FA]      [GetCurrentThreadId]
        [000343AC]      [000343AC]      [02A5]      [TlsSetValue]
        [000343BA]      [000343BA]      [02A2]      [TlsAlloc]
        ......
        [00034850]      [00034850]      [0022]      [CompareStringW]
        [00034862]      [00034862]      [0262]      [SetEnvironmentVariableA]

详细解释结构体每个成员的含义(加载前):

①联合体值为0时(一般用Characteristics判断是否是0),表示这是导入表结构体数组最后一个元素,除了最后这一个元素,其它每一个结构体都保存了一个dll信息。联合体的值不为0时,用OriginalFirstThunk(RVA)来索引INT的地址。这张INT表存放了该dll的导出函数的信息(序号与函数名)。

TimeDateStamp:当时间戳值为0时,表示未加载前IAT表与INT表完全相同;当时间戳不为0(为-1)时,表示IAT与INT表不同,IAT存储的是该dll的所有函数的绝对地址,这样在未加载前就直接填充函数地址的方式为函数地址的绑定,其地址是根据绑定导入表来确定的。也就是说当时间戳为-1时绑定导入表才有效,而真正的时间戳存放到绑定导入表中,否则无效。

ForwarderChain:一般情况下我们也可以忽略该字段。在老版的绑定中,它引用API的第一个forwarder chain(传递器链表)。

Name:RVA指向dll的名字字符串。

FirstThunk:RVA指向IAT表。

2、IAT(Import Address Table)、INT(import Name Table)结构解析:

关于绑定导入表和IAT表的特殊情况这里先不做研究,我们先来看看IAT和INT结构相同的时情况。加载到内存前我们看到IAT和INT都指向一个结构体数组,这个数组存储了序号和函数名。IAT和INT的元素为IMAGE_THUNK_DATA结构,而其指向为IMAGE_IMPORT_BY_NAME结构,这两个结构体如下所示:

IMAGE_THUNK_DATA结构体汇总只有一个联合体,一般用四字节的AddressOfData来获取IMAGE_IMPORT_BY_NAME的地址。

typedef struct _IMAGE_THUNK_DATA32 {
    union {
        DWORD ForwarderString;      // PBYTE 
        DWORD Function;             // PDWORD
        DWORD Ordinal;
        DWORD AddressOfData;        //RVA 指向_IMAGE_IMPORT_BY_NAME 
    } u1;
} IMAGE_THUNK_DATA32;
typedef IMAGE_THUNK_DATA32 * PIMAGE_THUNK_DATA32;

IMAGE_IMPORT_BY_NAME里有两个成员一个是序号一个是函数名。

typedef struct _IMAGE_IMPORT_BY_NAME {
    WORD    Hint;       //可能为0,编译器决定,如果不为0,是函数在导出表中的索引
    BYTE    Name[1];    //函数名称,以0结尾,由于不知道到底多长,所以干脆只给出第一个字符,找到0结束
} IMAGE_IMPORT_BY_NAME, *PIMAGE_IMPORT_BY_NAME;

注意:一个IMAGE_THUNK_DATA32结构占用四字节,索引一个函数名/序号,但是索引是有条件的,即四字节的最高位如果为0则这四字节的值为IMAGE_IMPORT_BY_NAME的RVA;但是如果四字节的最高位为1,则不需要(不能够)用该值去索引IMAGE_IMPORT_BY_NAME,而是直接去掉最高位,剩下31位的值便是dll函数在导出表中的导出序号。如下所示,有最高位为0解析出来的也有最高位为1解析出来的导入表:

    //最高位为0,则根据值索引IMAGE_IMPORT_BY_NAME解析hint和name 
    【Name:WINSPOOL.DRV】 【NameAddr:000314EE】 【OriginalFirstThunk:00030390】   【tFirstThunk:0002844C】  【TimeDateStamp:00000000】
        ThunkOffset     ThunkValue      Hint        API Name
        [000314B8]      [000314B8]      [001B]      [ClosePrinter]
        [000314C8]      [000314C8]      [0046]      [DocumentPropertiesA]
        [000314DE]      [000314DE]      [007D]      [OpenPrinterA]
    【Name:ADVAPI32.dll】 【NameAddr:00031590】 【OriginalFirstThunk:0002FF44】   【tFirstThunk:00028000】  【TimeDateStamp:00000000】
        ThunkOffset     ThunkValue      Hint        API Name
        [0003157E]      [0003157E]      [0204]      [RegSetValueExA]
        [0003156C]      [0003156C]      [01D1]      [RegCreateKeyExA]
        [0003155A]      [0003155A]      [01F6]      [RegQueryValueA]
        [0003154C]      [0003154C]      [01EB]      [RegOpenKeyA]
        [0003153E]      [0003153E]      [01DD]      [RegEnumKeyA]
        [0003152E]      [0003152E]      [01D4]      [RegDeleteKeyA]
        [0003151E]      [0003151E]      [01EC]      [RegOpenKeyExA]
        [0003150A]      [0003150A]      [01F7]      [RegQueryValueExA]
        [000314FC]      [000314FC]      [01CB]      [RegCloseKey]   
    【Name:SHLWAPI.dll】  【NameAddr:000315C8】 【OriginalFirstThunk:000301E4】   【FirstThunk:000282A0】   【TimeDateStamp:00000000】
        ThunkOffset     ThunkValue      Hint        API Name
        [0003159E]      [0003159E]      [002F]      [PathFindExtensionA]
        [000315B4]      [000315B4]      [0031]      [PathFindFileNameA]
    //最高位为1,去掉最高位得到函数序号
    【Name:OLEAUT32.dll】 【NameAddr:000315D4】 【OriginalFirstThunk:000301D4】   【FirstThunk:00028290】   【TimeDateStamp:00000000】
        ThunkOffset     ThunkValue      Hint        API Name
        [00000009]      [00000009]      [--]        函数序号[0009H:9D]
        [0000000C]      [0000000C]      [--]        函数序号[000CH:12D]
        [00000008]      [00000008]      [--]        函数序号[0008H:8D]

以上是程序加载前的情况,IAT和INT指向同一结构,而加载后INT不变依旧保存dll函数名与函数序号的地址信息。而IAT则根据导入表INT(IAT加载前)的内容和导出表信息,修改为对应的函数的地址信息,如下所示:
PE文件学习笔记(五):导入表、IAT、绑定导入表解析_第2张图片

3、绑定导入表(Bound Import Descriptor)与IAT:

我们上面分析了加载前,IAT中存储非函数地址的情况,下面我们来分析加载前IAT表中存储函数地址的情况。IAT中存储的函数地址是dll未加载的地址,当PE文件中不存在绑定导入表时,IAT就与INT一样,此时导入表中的时间戳就为0;否则导入表中的时间戳为-1时,dll的真正时间戳存放于绑定导入表中(绑定导入表地址存放在数据目录的第12项,IAT是第13项)。
现在大多数情况,导入表的TimeDateStamp都为0,而Windows早期的自带软件(如WinXP的notepad.exe)基本都采用了TimeDateStamp为-1的情况即包含绑定导入表的情况。PE中包含导入表的优点是程序启动快,但是其缺点也十分明显,当存在dll地址重定位和dll修改更新,则绑定导入表也需要修改更新。

绑定导入表的结构由两个结构体来组成:

//最后一个结构全0表示绑定导入表结束
typedef struct _IMAGE_BOUND_IMPORT_DESCRIPTOR {
    DWORD   TimeDateStamp;      //表示绑定的时间戳,如果和PE头中的TimeDateStamp不同则可能被修改过
    WORD    OffsetModuleName;   //dll名称地址
    WORD    NumberOfModuleForwarderRefs;    //依赖dll个数
// Array of zero or more IMAGE_BOUND_FORWARDER_REF follows
} IMAGE_BOUND_IMPORT_DESCRIPTOR,  *PIMAGE_BOUND_IMPORT_DESCRIPTOR;

NumberOfModuleForwarderRefs是指该dll自身依赖的dll的个数。值为n代表该结构后面紧跟了n个IMAGE_BOUND_FORWARDER_REF结构。之后才是导入表导入的下一个dll的结构。而IMAGE_BOUND_FORWARDER_REF结构体如下所示:

typedef struct _IMAGE_BOUND_FORWARDER_REF {
    DWORD   TimeDateStamp;  //时间戳,同样的作用检查更新情况
    WORD    OffsetModuleName;   //dll名称地址
    WORD    Reserved;   //保留
} IMAGE_BOUND_FORWARDER_REF, *PIMAGE_BOUND_FORWARDER_REF;

注意:这两个结构体中所有的OffsetModuleName均不是相对于ImageBase的RVA也不是FOA,而是相对于绑定导入表首地址的偏移地址,即:绑定导入表首地址 + OffsetModuleName= RVA

绑定导入表结构图解如下所示:
PE文件学习笔记(五):导入表、IAT、绑定导入表解析_第3张图片

打印出的WinXP自带notepad.exe的绑定导入表:

绑定导入表(Bound Import Descriptor):
    DllName:comdlg32.dll
        TimeDateStamp:[4802BDA2H:1208139170D]
        GMT:2008-04-14 02:12:50
        OffsetModuleName:0058
        NumberOfModuleForwarderRefs:[0000H:0D]
    DllName:SHELL32.dll
        TimeDateStamp:[4802BDB6H:1208139190D]
        GMT:2008-04-14 02:13:10
        OffsetModuleName:0065
        NumberOfModuleForwarderRefs:[0000H:0D]
    DllName:WINSPOOL.DRV
        TimeDateStamp:[4802BDCAH:1208139210D]
        GMT:2008-04-14 02:13:30
        OffsetModuleName:0071
        NumberOfModuleForwarderRefs:[0000H:0D]
    DllName:COMCTL32.dll
        TimeDateStamp:[4802BD6CH:1208139116D]
        GMT:2008-04-14 02:11:56
        OffsetModuleName:007E
        NumberOfModuleForwarderRefs:[0000H:0D]
    DllName:msvcrt.dll
        TimeDateStamp:[4802BD6CH:1208139116D]
        GMT:2008-04-14 02:11:56
        OffsetModuleName:008B
        NumberOfModuleForwarderRefs:[0000H:0D]
    DllName:ADVAPI32.dll
        TimeDateStamp:[4802BD89H:1208139145D]
        GMT:2008-04-14 02:12:25
        OffsetModuleName:0096
        NumberOfModuleForwarderRefs:[0000H:0D]
    DllName:KERNEL32.dll
        TimeDateStamp:[4802BDC6H:1208139206D]
        GMT:2008-04-14 02:13:26
        OffsetModuleName:00A3
        NumberOfModuleForwarderRefs:[0001H:1D]
        ###############################################
        DllName:NTDLL.DLL
            TimeDateStamp:4802BDC5
            GMT:2008-04-14 02:13:25
            OffsetModuleName:00B0
            Reserved:0000
    DllName:GDI32.dll
        TimeDateStamp:[4802BD81H:1208139137D]
        GMT:2008-04-14 02:12:17
        OffsetModuleName:00BA
        NumberOfModuleForwarderRefs:[0000H:0D]
    DllName:USER32.dll
        TimeDateStamp:[4802BDBDH:1208139197D]
        GMT:2008-04-14 02:13:17
        OffsetModuleName:00C4
        NumberOfModuleForwarderRefs:[0000H:0D]

IAT表部分信息:

IAT表(Import Address Table):
    dllName:【comdlg32.dll】:
        Function Addr:[76344906]
        Function Addr:[763385CE]
        Function Addr:[76349D84]
        Function Addr:[7633C3E1]
        Function Addr:[76322306]
        Function Addr:[76337B9D]
        Function Addr:[76338602]
        Function Addr:[76330036]
        Function Addr:[76337C2B]
    dllName:【SHELL32.dll】:
        Function Addr:[7D647C18]
        Function Addr:[7D5E18CE]
        Function Addr:[7D5FB1A9]
        Function Addr:[7D632E6F]
    dllName:【WINSPOOL.DRV】:
        Function Addr:[72F7643C]
        Function Addr:[72F74D40]
        Function Addr:[72F75091]
    dllName:【COMCTL32.dll】:
        Function Addr:[7718D270]
    dllName:【msvcrt.dll】:
        Function Addr:[4CFB2DAE]
        Function Addr:[4CFB9E9A]
        ......

与上面IAT所对应的INT表的部分信息(INT与IAT是一一对应的):

导入表(Import Descriptor):
    【Name:comdlg32.dll】 【NameAddr:00006EAC】 【OriginalFirstThunk:00006D90】   【FirstThunk:000006C4】   【TimeDateStamp:FFFFFFFFThunkOffset     ThunkValue      Hint        API Name
        [00006E7A]      [00006E7A]      [000F]      [PageSetupDlgW]
        [00006E5E]      [00006E5E]      [0006]      [FindTextW]
        [00006E9E]      [00006E9E]      [0012]      [PrintDlgExW]
        [00006E50]      [00006E50]      [0003]      [ChooseFontW]
        [00006E40]      [00006E40]      [0008]      [GetFileTitleW]
        [00006E8A]      [00006E8A]      [000A]      [GetOpenFileNameW]
        [00006E6A]      [00006E6A]      [0015]      [ReplaceTextW]
        [00006E14]      [00006E14]      [0004]      [CommDlgExtendedError]
        [00006E2C]      [00006E2C]      [000C]      [GetSaveFileNameW]Name:SHELL32.dll】  【NameAddr:00006EFA】 【OriginalFirstThunk:00006C40】   【FirstThunk:00000574】   【TimeDateStamp:FFFFFFFFThunkOffset     ThunkValue      Hint        API Name
        [00006EC8]      [00006EC8]      [001F]      [DragFinish]
        [00006ED6]      [00006ED6]      [0023]      [DragQueryFileW]
        [00006EE8]      [00006EE8]      [001E]      [DragAcceptFiles]
        [00006EBA]      [00006EBA]      [0103]      [ShellAboutW]Name:WINSPOOL.DRV】 【NameAddr:00006F3A】 【OriginalFirstThunk:00006D80】   【FirstThunk:000006B4】   【TimeDateStamp:FFFFFFFFThunkOffset     ThunkValue      Hint        API Name
        [00006F16]      [00006F16]      [0078]      [GetPrinterDriverW]
        [00006F06]      [00006F06]      [001B]      [ClosePrinter]
        [00006F2A]      [00006F2A]      [007E]      [OpenPrinterW]Name:COMCTL32.dll】 【NameAddr:00006F5E】 【OriginalFirstThunk:00006AEC】   【FirstThunk:00000420】   【TimeDateStamp:FFFFFFFFThunkOffset     ThunkValue      Hint        API Name
        [00006F48]      [00006F48]      [0008]      [CreateStatusWindowW]Name:msvcrt.dll】   【NameAddr:00007076】 【OriginalFirstThunk:00006DB8】   【FirstThunk:000006EC】   【TimeDateStamp:FFFFFFFFThunkOffset     ThunkValue      Hint        API Name
        [00006FDC]      [00006FDC]      [004E]      [_XcptFilter]
        [00006FD4]      [00006FD4]      [00F6]      [_exit]
        ......

4、代码解析导入表(INT、IAT)与绑定导入表:

void PETool::print_ImportDescriptor()
{
    fprintf(fp_peMess, "导入表(Import Descriptor):\n");
    if(dataDir[1].VirtualAddress == 0){
        fprintf(fp_peMess, "\t不存在导入表!\n");
        return;
    }
    char str[TIMESTRING] = {0};
    //导入表为数据目录的第2项,将import指向导入表第一个结构体
    IMAGE_IMPORT_DESCRIPTOR * import = (IMAGE_IMPORT_DESCRIPTOR *)(pFileBuffer + RVAToFOA(dataDir[1].VirtualAddress));
    while(true){
        if(import->Characteristics == 0){
            break;//最后一个结构体20字节为0则结束(直接判断一个Characteristics即可)
        }
        DWORD name = RVAToFOA(import->Name);
        DWORD original_ft = RVAToFOA(import->OriginalFirstThunk);
        DWORD ft = RVAToFOA(import->FirstThunk);
        //打印结构体信息
        fprintf(fp_peMess, "\t【Name:%s】\t"
                           "【NameAddr:%08X】\t"
                           "【OriginalFirstThunk:%08X】\t"
                           "【FirstThunk:%08X】\t"
                           "【TimeDateStamp:%08X】\n",
                pFileBuffer + name, name, original_ft, ft, import->TimeDateStamp);
        memset(str, 0, TIMESTRING);

        IMAGE_THUNK_DATA32 * thunk = (IMAGE_THUNK_DATA32 * )(pFileBuffer + original_ft);
        //打印INT表的详细信息
        print_INT(thunk);
        import++;
    }
}
void PETool::print_INT(IMAGE_THUNK_DATA32 * thunk)
{
    fprintf(fp_peMess, "\t\tThunkOffset\t\tThunkValue\t\tHint\t\tAPI Name\n");
    while(true){
        DWORD thunkValue = thunk->u1.AddressOfData;
        if(thunkValue == 0){
            break;//读取完毕
        }
        if(thunkValue >> 31){//最高位为1打印序号
            DWORD rva = thunkValue & 0X7FFFFFFF;//去掉最高位才是实际的值,否则RVAToFOA会出错
            DWORD offset = RVAToFOA(rva);
            fprintf(fp_peMess, "\t\t[%08X]\t\t[%08X]\t\t[--]\t\t函数序号[%04XH:%dD]\n",
                    offset, offset, rva, rva);
        }else{//最高位为0打印名称
            DWORD offset = RVAToFOA(thunkValue);
            //获取IMAGE_IMPORT_BY_NAME的地址
            IMAGE_IMPORT_BY_NAME * byName = (IMAGE_IMPORT_BY_NAME * )(pFileBuffer + offset);
            fprintf(fp_peMess, "\t\t[%08X]\t\t[%08X]\t\t[%04X]\t\t[%s]\n",
                    offset, offset, byName->Hint, byName->Name);
        }
        thunk++;
    }
}

void PETool::print_IAT()
{
    fprintf(fp_peMess, "IAT表(Import Address Table):\n");
    IMAGE_IMPORT_DESCRIPTOR * import = (IMAGE_IMPORT_DESCRIPTOR *)(pFileBuffer + RVAToFOA(dataDir[1].VirtualAddress));
    while(true){
        if(import->Characteristics == 0){
            break;
        }
        DWORD * addr = (DWORD *)(pFileBuffer + RVAToFOA(import->FirstThunk));
        //根据导入表的时间戳判断IAT中存放的是函数地址还是名字结构体的地址
        if(import->TimeDateStamp == -1){//函数地址
            fprintf(fp_peMess, "\tdllName:【%s】:\n", pFileBuffer + RVAToFOA(import->Name));
            for(int i = 0; addr[i]; i++){
                fprintf(fp_peMess, "\t\tFunction Addr:[%08X]\n", addr[i]);
            }
        }
        else if(import->TimeDateStamp == 0){//等同于INT表
            fprintf(fp_peMess, "\t等同于INT表!\n");
            break;
        }
        import++;
    }
}

void PETool::print_BoundImportDescriptor()
{
    fprintf(fp_peMess, "绑定导入表(Bound Import Descriptor):\n");
    if(dataDir[11].VirtualAddress == 0){
        fprintf(fp_peMess, "\t不存在绑定导入表!\n");
        return;
    }
    DWORD desAddr = dataDir[11].VirtualAddress;//获取第一个Bound Import Descriptor的RVA
    char str[TIMESTRING] = {0};\
    DWORD stamp = 0, off = 0, ref = 0, i = 0;

    IMAGE_BOUND_IMPORT_DESCRIPTOR * bound = (IMAGE_BOUND_IMPORT_DESCRIPTOR * )(pFileBuffer + RVAToFOA(desAddr));
    while(bound->TimeDateStamp != 0 && bound->OffsetModuleName != 0){
        stamp = bound->TimeDateStamp;//获取时间戳
        TimeDateStampToString(stamp, str);//时间戳转时间
        off = bound->OffsetModuleName;//获取名字偏移地址
        ref = bound->NumberOfModuleForwarderRefs;//获取依赖dll数

        fprintf(fp_peMess, "\tDllName:%s\n", pFileBuffer + RVAToFOA(desAddr + off));
        fprintf(fp_peMess, "\t\tTimeDateStamp:[%08XH:%dD]\n", stamp, stamp);
        fprintf(fp_peMess, "\t\tGMT:%s\n", str);
        fprintf(fp_peMess, "\t\tOffsetModuleName:%04X\n", off);
        fprintf(fp_peMess, "\t\tNumberOfModuleForwarderRefs:[%04XH:%dD]\n", ref, ref);

        IMAGE_BOUND_FORWARDER_REF * boundFor = (IMAGE_BOUND_FORWARDER_REF *)(bound);
        for(boundFor++, i = 0; i < ref; i++, boundFor++){
            memset(str, 0, TIMESTRING);
            off = boundFor->OffsetModuleName;
            stamp = boundFor->TimeDateStamp;
            TimeDateStampToString(stamp, str);

            fprintf(fp_peMess, "\t\t###############################################\n");
            fprintf(fp_peMess, "\t\tDllName:%s\n", pFileBuffer + RVAToFOA(desAddr + off));
            fprintf(fp_peMess, "\t\t\tTimeDateStamp:%08X\n",stamp);
            fprintf(fp_peMess, "\t\t\tGMT:%s\n", str);
            fprintf(fp_peMess, "\t\t\tOffsetModuleName:%04X\n", off);
            fprintf(fp_peMess, "\t\t\tReserved:%04X\n", boundFor->Reserved);
        }
        bound = (IMAGE_BOUND_IMPORT_DESCRIPTOR *)(boundFor);//下一个绑定dll
        memset(str, 0, TIMESTRING);
    }
}

你可能感兴趣的:(COFF,PE/ELF)