panda1987

Ring3下Hook API实现分析

本文主要针对用户级别下HOOK API的方法进行一下总结。对应的，自然也有ring0下的HOOK API方法，但是这个需要一些驱动方面的基础，暂时不在本文讨论范围内。另外ring3下的HOOK API方法也有很多种，我只列举我所能想到的。

所谓HOOK API，与Windows 下的HOOK其实是完全两个概念，风马牛不相及。当然在之后的讨论中你也会看到有关于windows hook的讨论，但是这是另外一个话题了。

那么到底什么是HOOK API呢？我们可以暂且简单的认为HOOK API就是一种改变原始API功能的方法。最简单的例子莫过于MessageBox(其实是MessageBoxA或MessageBoxW)，我们可以通过HOOK这个API改变其功能，比如换个标题。目的很明确，就是改变原始API的行为，但是方法有多种。再继续讨论之前我们先要搞清楚一个问题，HOOK API是HOOK谁的API调用？当然你可以自己写一个程序，然后在这个程序里HOOK所有本程序MessageBoxA/W的调用，但是更多的用途是HOOK其他进程的。比如你可以HOOK一个进程的winsock函数从而监视其网络行为。既然是跨进程的，势必会用到DLL注入，这篇文章中也会介绍到几种基本的方法。如果你还不知道DLL注入是什么或者有什么用的话也无妨，因为不影响接下来对HOOK API的理解，你可以暂时理解为对本进程的HOOK。

接下来我们就针对HOOK API这个话题开始介绍，我们还是以MessageBoxA为例，它是定义在user32.dll中的一个函数。现在我们就假设我们要完成一个函数HookMessageBoxA(...), 在这个函数调用之后MessageBoxA的行为就改变了。HOOK API有几种方法意味着这个函数就有几种可能的实现，至于代码我会分段给出（所以可能不能直接拿来编译），只供参看。

1. 修改IAT

我们从最常用的方法开始：修改IAT. 如果你还不知道IAT是什么原理，不妨跟我一起看一下API调用的原理（暂不考虑LoadLibrary/GetProcAddress）.

试想一下，在我们的程序里调用MessageBoxA意味着什么？如果你没兴趣深入研究，不妨让我直接告诉你，每一个API的地址都保存在一个表里，这个表就叫IAT(import address table). 而相应的调用就是对这个表中某一项的引用。那么这个表中的地址是什么时候来的呢？就是在PE加载的时候。如果你对IAT有兴趣，不妨看一下这篇文章: http://blog.csdn.net/panda1987/archive/2010/10/08/5928078.aspx

现在你应该有思路了，既然我们知道API的地址保存在哪里，那我们只要更改这个地址的值，使它指向我们自定义的API不就可以了？是的，一点没错，而我们的关键是在于如果找到这个地址，这需要一些PE结构的基础。

ULONG_PTR UpdateIATAddress(ULONG_PTR OriginalFunction, ULONG_PTR HookedFunction, const TCHAR* szHookMoudleName, const char* szModuleNameForHookFunction = NULL) { if(OriginalFunction == NULL || HookedFunction == NULL) return NULL; DWORD dwSize = 0; HMODULE hModule = GetModuleHandle(szHookMoudleName); PIMAGE_IMPORT_DESCRIPTOR pImageImport = (PIMAGE_IMPORT_DESCRIPTOR) ImageDirectoryEntryToData (hModule, TRUE, IMAGE_DIRECTORY_ENTRY_IMPORT, &dwSize); if (NULL == pImageImport) return NULL; while (pImageImport->Name) { // If we have provided the module name and current import descriptor is not for this module, skip. if (szModuleNameForHookFunction != NULL && 0 != _strcmpi((char*)((PBYTE)hModule + pImageImport->Name), szModuleNameForHookFunction)) { ++pImageImport; continue; } PIMAGE_THUNK_DATA pImageThunkReal = (PIMAGE_THUNK_DATA)((PBYTE)hModule + pImageImport->FirstThunk); while (pImageThunkReal->u1.Function) { if (pImageThunkReal->u1.Function == OriginalFunction) { WriteAddress((ULONG_PTR*)&pImageThunkReal->u1.Function, HookedFunction); return (ULONG_PTR)&pImageThunkReal->u1.Function; } ++pImageThunkReal; } if(szModuleNameForHookFunction != NULL) // the function we want to hooked can't be found in this module, failed. return NULL; else // continue with next import descriptor since we don't have a module name. ++pImageImport; } return NULL; } ULONG_PTR UpdateIATAddress(const char* szFunctionName, ULONG_PTR HookedFunction, ULONG_PTR& IATAddress, const TCHAR* szHookMoudleName, const char* szModuleNameForHookFunction = NULL) { if(szFunctionName == NULL || HookedFunction == NULL) return NULL; DWORD dwSize = 0; HMODULE hModule = GetModuleHandle(szHookMoudleName); PIMAGE_IMPORT_DESCRIPTOR pImageImport = (PIMAGE_IMPORT_DESCRIPTOR) ImageDirectoryEntryToData (hModule, TRUE, IMAGE_DIRECTORY_ENTRY_IMPORT, &dwSize); if (NULL == pImageImport) return NULL; while (pImageImport->Name) { // If we have provided the module name and current import descriptor is not for this module, skip. if (szModuleNameForHookFunction != NULL && 0 != _strcmpi((char*)((PBYTE)hModule + pImageImport->Name), szModuleNameForHookFunction)) { ++pImageImport; continue; } PIMAGE_IMPORT_BY_NAME pImageImportByName = NULL; PIMAGE_THUNK_DATA pImageThunkOriginal = NULL; PIMAGE_THUNK_DATA pImageThunkReal = NULL; pImageThunkOriginal = (PIMAGE_THUNK_DATA)((PBYTE)hModule + pImageImport->OriginalFirstThunk); pImageThunkReal = (PIMAGE_THUNK_DATA)((PBYTE)hModule + pImageImport->FirstThunk); while (pImageThunkOriginal->u1.Function) { if ((pImageThunkOriginal->u1.Ordinal & IMAGE_ORDINAL_FLAG) != IMAGE_ORDINAL_FLAG) { pImageImportByName = (PIMAGE_IMPORT_BY_NAME)((PBYTE)hModule + pImageThunkOriginal->u1 .AddressOfData); if (0 == _strcmpi(szFunctionName, (char*)pImageImportByName->Name)) { ULONG_PTR OriginalFunctionAddr = pImageThunkReal->u1.Function; IATAddress = (ULONG_PTR)&pImageThunkReal->u1.Function; WriteAddress((ULONG_PTR*)IATAddress, HookedFunction); return OriginalFunctionAddr; } } ++pImageThunkOriginal; ++pImageThunkReal; } if(szModuleNameForHookFunction != NULL) // the function we want to hooked can't be found in this module, failed. return NULL; else // continue with next import descriptor since we don't have a module name. ++pImageImport; } return NULL; } BOOL HookFunction_1(ULONG_PTR OriginalFunction, ULONG_PTR HookedFunction, const TCHAR* szHookModuleName, const char* szModuleNameForHookFunction = NULL) { HOOK_INFO *pHookInfo = FindHookInfo(OriginalFunction); if (pHookInfo != NULL) { pHookInfo->mHookedFunction = HookedFunction; WriteAddress((ULONG_PTR*)pHookInfo->u.mIATAddress, HookedFunction); } else { if (gHookNumber == (MAX_HOOKS - 1)) return FALSE; ULONG_PTR IATAddress = UpdateIATAddress(OriginalFunction, HookedFunction, szHookModuleName, szModuleNameForHookFunction); if(OriginalFunction == NULL || IATAddress == NULL) return FALSE; gHookInfo[gHookNumber].mHookedFunction = HookedFunction; gHookInfo[gHookNumber].mOriginalFunction = OriginalFunction; gHookInfo[gHookNumber].u.mIATAddress = (ULONG_PTR)IATAddress; gHookNumber++; } return TRUE; } BOOL HookFunction_1(const char* szFunctionName, ULONG_PTR HookedFunction, const TCHAR* szHookModuleName, const char* szModuleNameForHookFunction = NULL) { ULONG_PTR IATAdress = 0; ULONG_PTR OriginalAddress = UpdateIATAddress(szFunctionName, HookedFunction, IATAdress, szHookModuleName, szModuleNameForHookFunction); if(OriginalAddress == NULL || IATAdress == NULL) return FALSE; HOOK_INFO *pHookInfo = FindHookInfo(OriginalAddress); if (pHookInfo != NULL) { pHookInfo->mHookedFunction = HookedFunction; WriteAddress((ULONG_PTR*)pHookInfo->u.mIATAddress, HookedFunction); } else { if (gHookNumber == (MAX_HOOKS - 1)) return FALSE; gHookInfo[gHookNumber].mHookedFunction = HookedFunction; gHookInfo[gHookNumber].mOriginalFunction = OriginalAddress; gHookInfo[gHookNumber].u.mIATAddress = (ULONG_PTR)IATAdress; gHookNumber++; } return TRUE; } BOOL UnhookFunction_1(ULONG_PTR HookedFunction) { // We can use the original function to find the hook info. HOOK_INFO* pHookInfo = FindHookInfo(HookedFunction, false); if(pHookInfo == NULL) return FALSE; ULONG_PTR* pIATAddress = (ULONG_PTR*)pHookInfo->u.mIATAddress; WriteAddress(pIATAddress, pHookInfo->mOriginalFunction); return TRUE; }

乍一看似乎比想象的复杂了一点：

1. 因为我把几种HOOK API的方法合在一个项目里了，有些数据结构和函数可能考虑到了共用。

2. 因为我考虑的不单是一个API的HOOK，所以需要一个数组来保存每个HOOK的信息。

不过没关系，稍微解释一下就明白了。搞清楚两个问题上面的代码就没有任何难处了：

1. 为了找到IAT中的对应项，我们需要提供什么？

2. 为了能恢复到原始的状态（没有HOOK之前的状态），我们需要保存什么？

我们先来看第一个问题，如果不考虑效率，我们只需要一个函数名或者函数地址。这也是提供了两个UpdateIATAddress的原因。当然如果能提供模块名（比如user32.dll）最好，能够提高效率。那么第二个问题是我们需要保存什么呢？原始API的地址必不可少，要不然怎么恢复？除此之外呢？新的API地址也一起保存下来吧，有时可能会用到，以防万一。另外还需要什么？理论上不需要了，但是从效率的角度考虑，我们也把对应IAT的地址保存下来了，否则下次恢复的时候又要重新找一遍。

除此之外，我们还需要了解看一下函数WriteAddress(ULONG_PTR* pAddress, ULONG_PTR value). 这个函数就是把value写入地址pAddress中. 但是不能直接写，因为这个地址可能是只读的，我们需要通过VirtualProtect改变其内存属性然后再写入。

那么我们的HookMessageBoxA呢？就很简单了：

int WINAPI MyMessageBoxA_1(HWND hWnd, LPCSTR lpText, LPCSTR lpCaption, UINT uType) { HMODULE hUser32 = GetModuleHandle(_T("user32.dll")); PFN_MessageBoxA pMessageBoxA = (PFN_MessageBoxA)GetProcAddress(hUser32, "MessageBoxA"); if(pMessageBoxA) return pMessageBoxA(hWnd, "Hooked", "MessageBoxA HOOK", uType); return 0; } void HookMessageBoxA() { HookFunction_1("MessageBoxA", (ULONG_PTR)MyMessageBoxA_1, _T("HookAPI.dll"), "user32.dll"); MessageBoxA(NULL, "MessageBoxA", "MessageBoxA", MB_OK); }

这里我们使用了MyMessageBoxA_1作为我们新的MessageBox. 所以当HookFunction_1之后的MessageBoxA调用的时候其实是走到了MyMessageBoxA_1中。那么还有一个问题，在我们自定义的MessageBoxA中如何使用原始的(也就是user32.dll中的)MessaegBoxA？在这个例子中比较简单，我们使用GetProcAddress就可以获得并直接使用。但是在后面的例子中会发现没有这么简单。另外在修改IAT这个方法中还有一个需要注意的地方，就是HookFunction_1对应的第三个参数。在这个例子中我们使用了"HookAPI.dll"，因为接下来MessageBoxA的调用在DLL中，如果需要Hook EXE中的MessageBoxA，那么我们需要相应的把这个参数改为NULL. 这意味着如果我们需要HOOK一个进程所有的MessageBoxA的调用，我们需要遍历所有的模块逐个HOOK. 这个工作量还是比较大的。

接下来我们总结一下用修改IAT这种方法进行API HOOK有什么问题：

1. 如果需要HOOK一个进程的API, 我们需要HOOK该进程所有的模块。甚至我们还要处理新导入的模块。

2. 如果这个API是用GetProcAddress获得的，这个办法失效。

3. DelayLoad道理同上。

4. 一些可能的特殊情况: http://www.codeproject.com/KB/DLL/Win32APIHooking_Trouble.aspx

2. Jump

这个方法解决了修改IAT方法的弊端。我们所做的是直接修改MessageBoxA的开始几个字节，使他跳转到我们自己的函数。这个时候问题来了，我们如何在我们新的API里调用原始的？肯定不能直接用了，因为它已经被我们更改过了。我们需要在使用之前恢复到原始状态。那么还有一个问题，保存几个字节为好？我们需要的无非就是一个Jump指令，Jump指令有两种：相对跳转和绝对跳转。相比而言相对跳转更简单，也更节约空间:E9 XXXX(相对地址). 另外使用相对跳转的好处还有一点：x86和x64格式一样，都是5个字节。但是问题来了，相对跳转能跳多远？正负2G.对于x86已经足够了，因为0x80000000(当然你可以设置系统空间为1G，这里不考虑)开始属于系统空间，而我们定义的API跟user32中的API都同时位于用户空间。而对于x64来说，2G太小了。所以我们不得不在必要的时候使用绝对跳转。x86和x64下有不同的指令格式:

FF 25 XXXX

YYYY

这个是x86的. XXXX表示下一行指令的绝对地址，而YYYY表示我们的API的绝对地址。总共10个字节。

FF 25 0000

YYYYYYYY

这个是x64的. YYYYYYYY表示我们的API的绝对地址。总共14字节。

理解了这些，我们先看两个函数：

//////////////////////////////////////////////////////////////////////// // Used for the JMP and Bridge solution. // Both JMP and Bridge solution need to write JMP into a target address // However, there are three different cases: // 1. The two addresses have a distance less than 2GB(2GB - 128K). // 2. More than 2GB, x86. // 3. More than 2GB, x64. // Following are some details: // 1. If less than 2GB, we can use 'E9 XXXX'. XXXX is a relative value // with 32-bit. This is same for x86 and x64. 1 + 4 = 5bytes // 2. If more than 2GB. We can't use relative jump any more. So we have // to use absolute jump. // x86: FF25 XXXX XXXX: --- 2 + 4 + 4 = 10bytes // x64: FF25 0(XXXX) XXXXXXXX: --- 2 + 4 + 8 = 14bytes // That's the reason how 5, 10, 14 comes from. Actually, I think it's not // necessary to have both 1st case and the 2nd case. The bridge solution // will still work fine if you remove any one of them. ///////////////////////////////////////////////////////////////////////// BYTE GetJumpSize(ULONG_PTR PosA, ULONG_PTR PosB) { ULONG_PTR res = max(PosA, PosB) - min(PosA, PosB); if (res <= (ULONG_PTR) 0x7FFF0000) { return 5; } else { #ifdef _M_IX86 return 10; #else ifdef _M_AMD64 return 14; #endif } return 0; } ////////////////////////////////////////////////////////////////////// // Used for the JMP and Bridge solution. // Write JMP into the target address according to the three different // situations we discussed above. ////////////////////////////////////////////////////////////////////// void WriteJump(void* pAddress, ULONG_PTR JumpTo) { DWORD dwOldProtect; VirtualProtect(pAddress, JUMP_WORST, PAGE_READWRITE, &dwOldProtect); BYTE *pDst = (BYTE *)pAddress; ULONG_PTR dis = max(JumpTo, (ULONG_PTR)pAddress) - min(JumpTo, (ULONG_PTR)pAddress); if (dis <= (ULONG_PTR) 0x7FFF0000) { *(pDst++) = 0xE9; DWORD dwRelAddr = (DWORD)(JumpTo - (ULONG_PTR)pAddress) - 5; memcpy(pDst, &dwRelAddr, sizeof(DWORD)); } else { #ifdef _M_IX86 *(pDst++) = 0xFF; *(pDst++) = 0x25; *((DWORD *)pDst) = (DWORD)(((ULONG_PTR)pDst) + sizeof(DWORD)); pDst += sizeof(DWORD); *((ULONG_PTR *)pDst) = JumpTo; #else ifdef _M_AMD64 *(pDst++) = 0xFF; *(pDst++) = 0x25; *((DWORD*)pDst) = 0; pDst += sizeof(DWORD); *((ULONG_PTR *)pDst) = JumpTo; #endif } DWORD dwNotUsed; VirtualProtect(pAddress, JUMP_WORST, dwOldProtect, &dwNotUsed); }

代码不难理解。那么在这种方法中我们需要保存什么呢？原始API地址和新的API地址毫无疑问是我们需要的，除此之外我们还需要记录被修改的字数以及字节数，另外由于这种方法的特殊性，我们需要记录一个状态能够知道当前是否处于HOOK状态。这些信息我们存在一个指针中:mSavedData. 第一个字节表示HOOK状态，第二个字节表示修改的字节数，其余的字节表示被修改的字节，用于以后恢复。

void UpdateOriginalFunction(HOOK_INFO* pHookInfo, bool bRestoreAPI) { BYTE swapBuf[JUMP_WORST] = {0}; // temp buffer for swap BYTE* pSaveData = (BYTE*)pHookInfo->u.mSavedData; BOOL bHooked = pSaveData[0]; // the first byte of the saved data indicates the hook state. // If it is hooked and we want to hook again, nothing to do. // If it is unhooked and we want to restore original API, nothing to do. if((bHooked && !bRestoreAPI) || (!bHooked && bRestoreAPI)) return; DWORD dwOldProtect; VirtualProtect((LPVOID)pHookInfo->mOriginalFunction, JUMP_WORST, PAGE_READWRITE, &dwOldProtect); pSaveData[0] = !bRestoreAPI; // always update the hook state. 0 - unhooked / 1 - hooked. DWORD dwSavedLen = pSaveData[1]; // the second byte of the saved data indicates the length of saved data. // Exchange data between the original function and saved executable data. memcpy(swapBuf, (const void*)pHookInfo->mOriginalFunction, dwSavedLen); memcpy((void*)pHookInfo->mOriginalFunction, &pSaveData[2], dwSavedLen); memcpy(&pSaveData[2], swapBuf, dwSavedLen); DWORD dwNotUsed; VirtualProtect((LPVOID)pHookInfo->mOriginalFunction, JUMP_WORST, dwOldProtect, &dwNotUsed); } BOOL HookFunction_2(ULONG_PTR OriginalFunction, ULONG_PTR HookedFunction) { HOOK_INFO *pHookInfo = FindHookInfo(OriginalFunction); if(pHookInfo != NULL) { // Actually this is not one hundred percent safe. That depends on the distance // between the new hooked function and the old hooked function. However, if they // are provided from the same module, it is safe enough to do like this. BYTE *pSavedInfo = (BYTE*) pHookInfo->u.mSavedData; // It's necessary to save the original bytes again, since the saved data may be // updated after unhook. Actually it will be updated in UpdateOriginalFunction. if(pSavedInfo[0] == 0) { memcpy(pSavedInfo + 2, (const void*)OriginalFunction, pSavedInfo[1]); } if(pSavedInfo[0] == 0 || pHookInfo->mHookedFunction != HookedFunction) { pHookInfo->mHookedFunction = HookedFunction; WriteJump((void*)OriginalFunction, HookedFunction); } pSavedInfo[0] = 1; } else { if (gHookNumber == (MAX_HOOKS - 1)) return FALSE; gHookInfo[gHookNumber].mHookedFunction = HookedFunction; gHookInfo[gHookNumber].mOriginalFunction = OriginalFunction; BYTE chJumpSize = GetJumpSize(OriginalFunction, HookedFunction); BYTE *pSavedInfo = new BYTE[chJumpSize + 2]; pSavedInfo[0] = 1; // the first byte indicates the hook state. pSavedInfo[1] = chJumpSize; // the second byte indicates the length of saved data. memcpy(pSavedInfo + 2, (const void*)OriginalFunction, chJumpSize); gHookInfo[gHookNumber].u.mSavedData = (ULONG_PTR)pSavedInfo; WriteJump((void*)OriginalFunction, HookedFunction); gHookNumber++; } return TRUE; } BOOL UnhookFunction_2(ULONG_PTR OriginalFunction) { HOOK_INFO *pHookInfo = FindHookInfo(OriginalFunction); if(pHookInfo == NULL) return FALSE; UpdateOriginalFunction(pHookInfo, true); return TRUE; } int WINAPI MyMessageBoxA_2(HWND hWnd, LPCSTR lpText, LPCSTR lpCaption, UINT uType) { int ret = 0; HOOK_INFO* pHookInfo = FindHookInfo((ULONG_PTR)MessageBoxA); if(pHookInfo == NULL) { return 0; } UpdateOriginalFunction(pHookInfo, true); ret = MessageBoxA(hWnd, "Hooked", "MessageBoxA HOOK", uType); UpdateOriginalFunction(pHookInfo, false); return ret; } void HookMessageBoxA() { HookFunction_2((ULONG_PTR)MessageBoxA, (ULONG_PTR)MyMessageBoxA_2); MessageBoxA(NULL, "MessageBoxA", "MessageBoxA", MB_OK); }

原本在几个cpp中的代码我全部放到这里了，UpdateOriginalFunction用于交换原始API的开头的几个字节与保存下来的字节。为什么是交换？将保存下来的字节恢复到原始API不就可以了么？是的，其实这就足够了，但是我们为了方便再次HOOK，我们交换来交换去，这样方便很多。所以在新的API中如果要使用原始的API我们所需要做的就像这样:

... UpdateOriginalFunction(pHookInfo, true); // 恢复原始API ret = MessageBoxA(hWnd, "Hooked", "MessageBoxA HOOK", uType); UpdateOriginalFunction(pHookInfo, false); // 再次HOOK ...

另外在HookFunction_2中的if(pHookInfo != NULL)这个条件你不用关心，这个是处理已经HOOK以后再次HOOK，属于特殊情况。我们关心else部分就足够了。

确实，这个办法要比第一种好很多。我们不需要针对每个模块逐个HOOK了，也不担心GetProcAddress引起的问题。但是，这个方法确不能很好地在多线程环境中工作，因为如果在恢复原始API之后线程切换并调用了这个API，那么我们是HOOK不到的。这个不难理解。

3. 拷贝函数

这个方法的想法是这样的，我们可以在内存中拷贝一份原始的实现。这样我们如果需要调用原始函数的时候就不需要跟第二种方法一样恢复原始API了，同时也很好的解决了多线程的问题。但是新的问题产生了，哪里去找原始API的实现？即使我们知道MessageBoxA位于user32.dll中，我们也知道这个函数位于user32的具体地址。但是我们如何知道函数到哪里结束？如果这个函数简单的不能再简单，或者我们能推测这个函数的长度，然后拷贝一份到内存。但是通常没有这么简单。有一个相对比较好的变通的方法，我们可以拷贝整个DLL的实现（DLL的长度不难获得），然后根据这个函数在这个DLL中的地址推测在新的API在拷贝内存中的地址: x = baseNewAlloc + (oldAddrOfAPI - oldAddrOfDLL)

这样我们唯一需要做的就是两件事情1. 拷贝DLL. 2. 更新原始DLL中的API使其跳转.

这种方法有一个不足的地方就是占用内存。一个DLL可能有好几兆，就为了HOOK一个API花的代价似乎有点大。这种方法我没有尝试，不难实现。

4. Bridge

这种方法相比第二种具有多线程性，相比第三种不需要浪费这么多的内存。应该说是一种值得考虑的HOOK API方法。我们回想一下第二种方法，我们在一个API的头部写入了一个jump指令，虽然我们把原来的字节都保存下来了，但是如果不恢复到原始API中的话这些字节其实是没有意义的。因为很有可能我们在写入Jump的时候把一个指令拆分了。试想，如果有一种方法能够取到一个完整的指令，那我们是不是可以保存几条完整的指针到某一个地方，然后再跳转到原始API的某个位置（同时也是一条完整指令的开始）。具体说来大概是这样(以MessageBoxA为例)：

7657FEAE 8B FF mov edi,edi

7657FEB0 55 push ebp

7657FEB1 8B EC mov ebp,esp

7657FEB3 6A 00 push 0

其实这不是一个很好的例子，因为写入一个jump需要5个字节，而5个字节正好是一个指令的结尾。现在想象一下第三条指令需要三个字节，那么5个字节正好位于这条指令的中间。于是，我们可以这样：

1. 在原始API的开头位置写入一个Jump(5个指令). Jump到哪里呢？当然是我们自己的API.

2. 拷贝6个字节的指令到一个内存地址(我们称之bridge). 这样这6个字节就是完整的，可以独立的运行.

3. 在这个bridge的后面，也就是第7个字节再写入一个Jump. 这次Jump到哪里呢？Jump到原始API的第7个字节。这又是一个指令的开始。

再回顾一下，我们把原始的API分割成两个完整的部分，然后通过一个Jump(bridge中的Jump)将这两个部分连接起来。那么bridge什么时候会用到？就是在我们自己的API里面！是不是很巧妙？

别忘了还有一个问题我们没有解决，如何才能判断一个完整的指令？有一个第三方的库可以帮助我们完成这个事情:distorm. 它不但支持x86还支持x64。通过这个工具，我们可以从一串二进制代码中分析出对应的汇编代码。

void *CreateBridge(ULONG_PTR Function, const DWORD dwJumpSize) { if (gBridgeBuffer == NULL) return NULL; #define MAX_INSTRUCTIONS 100 _DecodeResult res; _DecodedInst decodedInstructions[MAX_INSTRUCTIONS]; unsigned int decodedInstructionsCount = 0; #ifdef _M_IX86 _DecodeType dt = Decode32Bits; #else ifdef _M_AMD64 _DecodeType dt = Decode64Bits; #endif _OffsetType offset = 0; res = distorm_decode(offset, // offset for buffer (const BYTE *) Function, // buffer to disassemble 50, // function size (code size to disasm) // 50 instr should be _quite_ enough dt, // x86 or x64? decodedInstructions, // decoded instr MAX_INSTRUCTIONS, // array size &decodedInstructionsCount // how many instr were disassembled? ); if (res == DECRES_INPUTERR) return NULL; DWORD dwInstrSize = 0; void *pBridge = (void*)&gBridgeBuffer[gBufferIndex]; for (UINT x = 0; x < decodedInstructionsCount; x++) { if (dwInstrSize >= dwJumpSize) break; BYTE *pCurInstr = (BYTE *)(dwInstrSize + (ULONG_PTR)Function); // Unfortunately, some instructions have relative address. These addresses can not be used // directly in our bridge. We have to handle these kind of instructions ourselves. Some of // them may have different length on x86 and x64. It's not easy to find out all of them so // I'll do this when I find one. Following is an example I found when hook MessageBoxA: if (*pCurInstr == 0x44/*cmp*/) { #ifdef _M_AMD64 // Following is a example for cmp: MessageBoxA // 0x771B118F: 44 39 1D A6 0F 02 00 -- cmp dwordptr[771D213Ch], r11d // 0x771B1196: ... // 00 02 0F A6 is the relative address from 0x771B1196 to 0x771D213C ULONG_PTR OriginalRel = *(DWORD*)(pCurInstr + 3); ULONG_PTR AbsoluteAddr = OriginalRel + (ULONG_PTR)pCurInstr + decodedInstructions[x].size; ULONG_PTR NextInstAddr = (ULONG_PTR)&gBridgeBuffer[gBufferIndex] + decodedInstructions[x].size; ULONG_PTR RelInBridge = AbsoluteAddr - NextInstAddr; // The new relative address is larger than 2GB. I have no idea about this. if(max(AbsoluteAddr, NextInstAddr) - min(AbsoluteAddr, NextInstAddr) > ((ULONG_PTR)1 << 31)) { return NULL; } memcpy(&gBridgeBuffer[gBufferIndex], (void*)pCurInstr, decodedInstructions[x].size); *(DWORD*)&gBridgeBuffer[gBufferIndex + 3] = (DWORD)RelInBridge; gBufferIndex += decodedInstructions[x].size; #endif } /* Following case is provided by the auther who wrote "Powerful x86/x64 Mini Hook-Engine". However, I haven't find such a case yet. So I commented it out temporarily. else if (*pCurInstr == 0x74) // jz { ULONG_PTR Dest = (dwInstrSize + (ULONG_PTR)Function) + (char) pCurInstr[1]; WriteJump(&gBridgeBuffer[gBufferIndex], Dest); gBufferIndex += dwJumpSize; } */ else { memcpy(&gBridgeBuffer[gBufferIndex], (void*)pCurInstr, decodedInstructions[x].size); gBufferIndex += decodedInstructions[x].size; } dwInstrSize += decodedInstructions[x].size; } WriteJump(&gBridgeBuffer[gBufferIndex], Function + dwInstrSize); gBufferIndex += GetJumpSize((ULONG_PTR)&gBridgeBuffer[gBufferIndex], Function + dwInstrSize); return pBridge; } BOOL HookFunction_3(ULONG_PTR OriginalFunction, ULONG_PTR HookedFunction) { HOOK_INFO *pHookInfo = FindHookInfo(OriginalFunction); if (pHookInfo) { pHookInfo->mHookedFunction = HookedFunction; WriteJump((void*)OriginalFunction, HookedFunction); } else { // If the hook info array is full or there is not enough space in the bridge buffer. if (gHookNumber == (MAX_HOOKS - 1) || gBufferIndex >= MAX_BRIDGE_BUF - 30/*Approximately*/) return FALSE; void *pBridge = CreateBridge(OriginalFunction, GetJumpSize(OriginalFunction, HookedFunction)); if (pBridge == NULL) return FALSE; gHookInfo[gHookNumber].mOriginalFunction = OriginalFunction; gHookInfo[gHookNumber].u.mHookBridge = (ULONG_PTR)pBridge; gHookInfo[gHookNumber].mHookedFunction = HookedFunction; gHookNumber++; WriteJump((void*)OriginalFunction, HookedFunction); } return TRUE; } BOOL UnhookFunction_3(ULONG_PTR OriginalFunction) { HOOK_INFO *pHookInfo = FindHookInfo(OriginalFunction); if (pHookInfo == NULL) return FALSE; // Actually the original API is not recovered byte by byte. It's only jumps to // the bridge then jump back immediately. It works as well. WriteJump((void*)pHookInfo->mOriginalFunction, pHookInfo->u.mHookBridge); return TRUE; } int WINAPI MyMessageBoxA_3(HWND hWnd, LPCSTR lpText, LPCSTR lpCaption, UINT uType) { PFN_MessageBoxA pMessageBoxA = (PFN_MessageBoxA)GetHookedBridge((ULONG_PTR)MyMessageBoxA_3); if(pMessageBoxA != NULL) return pMessageBoxA(hWnd, "Hooked", "MessageBoxA HOOK", uType); return 0; } void HookMessageBoxA() { HookFunction_3((ULONG_PTR)MessageBoxA, (ULONG_PTR)MyMessageBoxA_3); MessageBoxA(NULL, "MessageBoxA", "MessageBoxA", MB_OK); }

几点说明:

1. gBridgeBuffer是VirtualAlloc出来的一个内存块. 用于存放所有的Bridge.

2. gBufferIndex只是用于HOOK多个API时能够把Bridge连续的存放在gBridgeBuffer中.

3. 每个HOOK API对应的bridge的地址其实存放在mHookBridge中. 在新的API中我们正是通过这个值获得对应的bridge地址.

到此为止似乎这种办法没有任何弊端。但是再仔细看看CreateBridge中的一段代码:

if (*pCurInstr == 0x44/*cmp*/) { #ifdef _M_AMD64 // Following is a example for cmp: MessageBoxA // 0x771B118F: 44 39 1D A6 0F 02 00 -- cmp dwordptr[771D213Ch], r11d // 0x771B1196: ... // 00 02 0F A6 is the relative address from 0x771B1196 to 0x771D213C ULONG_PTR OriginalRel = *(DWORD*)(pCurInstr + 3); ULONG_PTR AbsoluteAddr = OriginalRel + (ULONG_PTR)pCurInstr + decodedInstructions[x].size; ULONG_PTR NextInstAddr = (ULONG_PTR)&gBridgeBuffer[gBufferIndex] + decodedInstructions[x].size; ULONG_PTR RelInBridge = AbsoluteAddr - NextInstAddr; // The new relative address is larger than 2GB. I have no idea about this. if(max(AbsoluteAddr, NextInstAddr) - min(AbsoluteAddr, NextInstAddr) > ((ULONG_PTR)1 << 31)) { return NULL; } memcpy(&gBridgeBuffer[gBufferIndex], (void*)pCurInstr, decodedInstructions[x].size); *(DWORD*)&gBridgeBuffer[gBufferIndex + 3] = (DWORD)RelInBridge; gBufferIndex += decodedInstructions[x].size; #endif }

这个代码是我在HOOK x64下的MessageBoxA/W是加上的。看一下注释不难发现有些指令可能是"相对"的，什么意思呢？就是指令操作数是相对的，我们一旦把这条指令拷贝到bridge中就挂了。当然我们可以手动的修改操作数使他指向原始位置，但是这无疑也是一个有难度的工作，因为我们不知道哪条指令是"相对"的，而且每条相对指令我们的处理方法也不是统一的，因为操作数位于指令的位置和长度可能不一样。我们所能做的就是遇到一个处理一个。

5. INT 3

还有一个HOOK API的方法就是利用SEH(不知道SEH是什么东西的话不妨自己百度下), 我们所要做的就是在API的开头写入0xCC(一个字节, 当然同时要保持原来的字节). 当这个API被调用到的时候就会产生一个软件异常，并调用异常处理函数，这里的异常处理函数就成了我们的新的API，我们需要提供这个异常处理函数并加入到SEH链表中(网上有很多教程)。在这里我们需要关心的是在这个异常处理函数中我们需要做什么，当然第一件事情是恢复原来的那个字节，然后让程序重新执行这条异常指令(这个是SEH提供的功能之一:再次执行异常指令)。这个时候不会再次产生异常，因为我们已经恢复了原始的API状态。结束了么？没有，我们还要找一个合适的时间把0xCC再次写入这个API的开头，否则下次再调用到这个API就HOOK不到了。这种方法我没有尝试，理论上没有问题。但是用这种方法似乎很难解决同时HOOK多个API的问题，当异常处理函数被调用的时候我如何知道是哪个HOOK函数被调用了呢？no idea about this...

远程HOOK API的问题...

关于HOOK API的问题暂且介绍到这里，之前我们提到了HOOK API往往是对其他进程进行HOOK. 现在我们针对这个问题再多说几句。我们先理一下思路，现在假设我们已经选定了一种方法(Jump-修改API的开始几个字节)对MessageBoxA进行HOOK, 我们需要做什么？

1. 我们需要提供一个自定义的MyMessageBoxA. 这个不难，通过VirtualAllocEx和WriteProcessMemory我们可以把一个函数拷贝到另外的进程中。

2. 我们还需要修改远程进程中原始API的开头几个字节。这个也可以实现，通过VritualProtect和WriteProcessMemory可以做到。新API在远程地址的地址是什么？就是第一步VirtualAllocEx返回的地址。

乍一看似乎已经完成了，至少当MessageBoxA被调用的时候能够成功得跳转到我们的MyMessageBoxA中。但是问题来了，在MyMessageBoxA里面我们能做什么？假设我们只想简单地调用原始API，怎么实现？思考一两分钟以后你会发现这是个严峻的问题。当然我们可以通过ReadProcessMemory在写入jump指令前先保存起来，但是保存在哪里？是我们自己的进程中。而MyMessageBoxA的调用是在目标进程中，如果要访问的话还要通过进程间通信。一个相对比较简单的办法是把这些字节也写到目标进程中，但是没这么简单，写到哪里？MyMessageBoxA怎么知道这个地址？其实这个问题我在研究Self Delete的时候就遇到过，一个可行的办法是把这些字节写在MyMessageBoxA的前面，然后通过一些标记字节寻找。不管怎样，这不是一个好的选择，工作量太大。

再来想一个问题，可能你只是想尝试这个办法是否能成功，所以在MyMessageBoxA你只是简单的调用了MessageBoxW. 可行么？答案是否定的...因为IAT变了...不明白的话再回想一下API调用的原理。实际上在MyMessageBoxA中我们不能使用任何API. 可见使用这种方法进行远程API的HOOK是没有什么意义的，虽然存在理论上的可行性。

既然这样，我们需要寻找一种更加灵活的办法。DLL无非是最好的选择，我们知道当一个DLL被加载到一个EXE的时候它其实已经成了这个EXE的一部分，它们共享同一个空间，而在这个DLL中做任何处理就像EXE自己的代码一样。万事俱备只欠东风了，我们唯一要做的是把这个DLL加载到目标EXE中，而我们希望做的事情可以放在DllMain中，这样一旦DLL被加载我们的代码就被调用了。接下来的话题就跟HOOK API没有关系了。

我们有很多种方法使一个DLL加载到目标进程，网上也可以找到很多这方面的话题。这里我主要介绍两种最常用的: 1. CreateRemoteThread+LoadLibrary. 2. SetWindowsHook.

CreateRemoteThread+LoadLibrary

CreateRemoteThread顾名思义是创建一个远程线程，我们先看一下这个函数的原型：

HANDLE WINAPI CreateRemoteThread( __in HANDLE hProcess, __in_opt LPSECURITY_ATTRIBUTES lpThreadAttributes, __in SIZE_T dwStackSize, __in LPTHREAD_START_ROUTINE lpStartAddress, __in_opt LPVOID lpParameter, __in DWORD dwCreationFlags, __out_opt LPDWORD lpThreadId );

我们最关心的参数有两个lpStartAddress和lpParameter. 很显然，这个是线程函数和参数的地址。但是，别忘了这些都是在目标线程中的地址，我们需要先拷贝到目标进程中。这个线程函数是我们随便定义的，只需要满足一个条件：只有一个指针型参数。既然如此，LoadLibrary是不是也满足？而且LoadLibrary的地址在每个进程中都一样，我们只要拷贝lpParameter到目标进程就可以了。代码如下：

DWORD InjectDll(HANDLE hProcess) { HANDLE hThread; char szLibPath[MAX_PATH]; void* pLibRemote = 0; // the address (in the remote process) where szLibPath will be copied to; DWORD hLibModule = 0; // base adress of loaded module (==HMODULE); HMODULE hKernel32 = GetModuleHandle("Kernel32"); LPTHREAD_START_ROUTINE pfnLoadLibrary = (LPTHREAD_START_ROUTINE)GetProcAddress(hKernel32, "LoadLibraryA"); // Get full path of "HookAPI.dll" HINSTANCE hHookAPI = LoadLibraryA("HookAPI.dll"); if(!GetModuleFileName(hHookAPI, szLibPath, MAX_PATH || hHookAPI == NULL)) return 0; pLibRemote = VirtualAllocEx(hProcess, NULL, sizeof(szLibPath), MEM_COMMIT, PAGE_READWRITE); if(pLibRemote == NULL) return 0; if(!WriteProcessMemory(hProcess, pLibRemote, (void*)szLibPath, sizeof(szLibPath), NULL)) { VirtualFreeEx(hProcess, pLibRemote, sizeof(szLibPath), MEM_RELEASE); return 0; } hThread = CreateRemoteThread(hProcess, NULL, 0, pfnLoadLibrary, pLibRemote, 0, NULL); VirtualFreeEx(hProcess, pLibRemote, sizeof(szLibPath), MEM_RELEASE); if(hThread == NULL) return 0; WaitForSingleObject(hThread, INFINITE); // Get the module address in the remote thread. GetExitCodeThread(hThread, &hLibModule); CloseHandle(hThread); return hLibModule; } BOOL UnmapDll(HANDLE hProcess, HMODULE hModule) { HMODULE hKernel32 = GetModuleHandle("Kernel32"); LPTHREAD_START_ROUTINE pfnFreeLibrary = (LPTHREAD_START_ROUTINE)GetProcAddress(hKernel32, "FreeLibrary"); if(pfnFreeLibrary == NULL) return FALSE; HANDLE hThread = CreateRemoteThread(hProcess, NULL, 0, pfnFreeLibrary, (void*)hModule, 0, NULL); if(hThread == NULL) return FALSE; WaitForSingleObject(hThread, INFINITE); GetExitCodeThread(hThread, (LPDWORD)&hModule); CloseHandle(hThread); return TRUE; }

这两个函数分别实现了DLL到目标进程的加载和卸载。代码就不多解释了。

SetWindowsHook

另外一种常用的方法是windows hook. 前面已经说过，windows hook跟hook api没有任何关系。windows hook常用于截获windows的消息，而在这里我们甚至没有用过这个功能，我们只是利用了windows hook的一个附带作用:会把DLL挂入目标进程。而接下来的一些基础知识有助于你对之后代码的理解：

1. SetWindowsHook需要提供一个相当于winproc一样的函数，消息来临时会被调用。另外还有一个参数可以指定希望HOOK的消息类型。

2. 并不是SetWindowsHook之后DLL就被加载到目标进程了，而是要等待第一个消息的来临。

3. 全局的SetWindowsHook会在一定程度上影响效率。而在我们的例子中我们只希望用它来挂入DLL，所以最好能在DLL挂入以后卸载掉这个windows hook. 但是在DLL挂入以后如果直接调用UnhookWindowsHook来解决这个问题是不可行的，因为DLL会被卸载(别忘了我们的自定义API就定义在DLL中)。

4. UnhookWindowsHook会导致DLL被卸载是因为DLL的引用计数为0了。LoadLibrary可以增加引用计数。

好了，整理一下思路，再来看下面的代码:

HINSTANCE g_hDll; #pragma data_seg(".shared") UINT WM_HOOKEX = 0; DWORD g_threadId = 0; HHOOK g_hHook = 0; #pragma data_seg() #pragma comment(linker,"/SECTION:.shared,RWS") void PrepareForWindowsHook(HMODULE hModule) // invoked in DllMain - DLL_PROCESS_ATTACH { g_hDll = (HINSTANCE)hModule; DisableThreadLibraryCalls(g_hDll); if(WM_HOOKEX == NULL) WM_HOOKEX = RegisterWindowMessage(_T("WM_HOOKEX")); } LRESULT HookProc(int code, WPARAM wParam, LPARAM lParam) { MSG* pMsg = (MSG*)lParam; if(pMsg->message == WM_HOOKEX) { if(pMsg->lParam) { ::UnhookWindowsHookEx(g_hHook); // Let's increase the reference count of the DLL (via LoadLibrary), // so it's NOT unmapped once the hook is removed; TCHAR szModuleName[MAX_PATH]; GetModuleFileName(g_hDll, szModuleName, MAX_PATH); if(!LoadLibrary(szModuleName)) { return ::CallNextHookEx(g_hHook, code, wParam, lParam); } } else { UnhookWindowsHookEx(g_hHook); FreeLibrary(g_hDll); } } return ::CallNextHookEx(g_hHook, code, wParam, lParam); } extern "C" _declspec(dllexport) BOOL InjectDll(DWORD dwThreadId) { g_hHook = SetWindowsHookEx(WH_GETMESSAGE, (HOOKPROC)HookProc, g_hDll, dwThreadId); if(g_hHook == NULL) return FALSE; BOOL bPosted = PostThreadMessage(dwThreadId, WM_HOOKEX, 0, 1); if(bPosted == FALSE) return FALSE; g_threadId = dwThreadId; return TRUE; } extern "C" _declspec(dllexport) BOOL UnmapDll() { g_hHook = SetWindowsHookEx(WH_GETMESSAGE, (HOOKPROC)HookProc, g_hDll, g_threadId); if(g_hHook == NULL) return FALSE; BOOL bPosted = PostThreadMessage(g_threadId, WM_HOOKEX, 0, 0); if(bPosted == FALSE) return FALSE; return TRUE; } 有了之前的基础，代码应该不难理解。

一个有意思的问题...

看到这里，其实这个话题已经结束了。但是如果你还是兴致盎然的话，不妨再看一个在我开发中遇到的一个有意思的问题。这其实也是我们"精益求精"的后果。为什么这么说呢？先来看一下我想做什么。

1. 我需要一个EXE简称A. 在这个EXE里面弹出一系列的MessageBoxA.

2. 我还需要一个EXE简称B, 上面有一个按钮。点击一下就HOOK住A中的MessageBoxA. 再点击一下UNHOOK. 如此往复。

是不是很简单？只要对这个按钮循环调用InjectDll/UnmapDll就可以。还记得我们有两套机制都提供了InjectDll/UnmapDll: 1.CreateRemoteThread+LoadLibrary. 2. windows hook. 第一种很显然InjectDll和UnmapDll分别会加载和卸载DLL. 而第二种由于我们考虑到了windows hook可能会影响到效率所以我们没有提供HookAPI/UnHookAPI这样的函数, 而是直接通过DLL的加载和卸载同时实现API的HOOK和UNHOOK. 但是问题来了, 试想下面的情形:

1. 启动A. 一个MessageBoxA弹出。这个时候是没有HOOK的。

2. 启动B. 点击按钮. 这个时候HOOK了(DLL加载了).

3. 点击A中MessageBoxA的OK. 又一个MessageBoxA弹出. 我们发现这个时候是HOOK住了.

4. 再次点击B中按钮. 这个时候我们希望A的下一个MessageBoxA是UNHOOK的. (DLL卸载了)

5. 点击A中MessageBoxA的OK. 程序异常退出。

没有跟我们设想的那样. 问题在哪里？

第三步弹出的MessageBoxA是HOOK住的，也就是在MyMessageBoxA中调用的。而MyMessageBoxA定义在HookAPI.dll中。第四步显然会把HookAPI.dll卸载掉. 而第五步我们点击OK以后其实程序的返回地址是在HookAPI.dll中, 而此时HookAPI.dll已经不在内存中了. 所以非法访问内存地址, 程序异常退出.

解决的办法当然很简单, 我们可以提供一个HookAPI/UnHookAPI这样的函数, 在B的按钮点击之后不卸载DLL, 而是简单的UNHOOK. 但是为什么说这个问题有意思呢, 是因为我联想到了Self Delete时遇到的一种方法。有没有什么办法只修改MyMessageBoxA让程序正常运行下去呢？也就是说，在MyMessageBoxA里面调用MessageBoxA之后要立刻返回到A(EXE)的地址空间(也就是下一条MessageBoxA的地址). 办法跟Self Delete其中一个方法如出一辙, 有兴趣的话可以看一下我之前那篇介绍Self Delete的文章. 这里我只给出代码, 不多解释了:

int WINAPI MyMessageBoxA(HWND hWnd, LPCSTR lpText, LPCSTR lpCaption, UINT uType) { DWORD dwRet = *(DWORD*)((DWORD)&hWnd - 4); PFN_MessageBoxA pMessageBoxA = (PFN_MessageBoxA)GetHookedBridge((ULONG_PTR)MyMessageBoxA_Special_3); if(pMessageBoxA == NULL) return 0; const char* strContent = "MessageBoxA HOOK"; const char* strCaption = "Hooked"; _asm { push uType push strCaption push strContent push hWnd push dwRet push pMessageBoxA ret } }

Over...Thanks for reading:)

你可能感兴趣的:(api,null,dll,import,hook,Descriptor)

LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
利用Requests Toolkit轻松完成HTTP请求 nseejrukjhad http 网络协议网络 python
RequestsToolkit的力量：轻松构建HTTP请求Agent在现代软件开发中，API请求是与外部服务交互的核心。RequestsToolkit提供了一种便捷的方式，帮助开发者构建自动化的HTTP请求Agent。本文旨在详细介绍RequestsToolkit的设置、使用和潜在挑战。引言RequestsToolkit是一个强大的工具包，可用于构建执行HTTP请求的智能代理。这对于想要自动化与外
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
用Python实现简单的猜数字游戏程序媛了了 python 游戏 java
猜数字游戏代码：importrandomdefpythonit():a=random.randint(1,100)n=int(input("输入你猜想的数字："))whilen!=a:ifn>a:print("很遗憾，猜大了")n=int(input("请再次输入你猜想的数字："))elifna::如果玩家猜的数字n大于随机数字a，则输出"很遗憾，猜大了"，并提示玩家再次输入。elifn
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
python多线程程序设计之一 IT_Beijing_BIT #Python 程序设计语言 python
python多线程程序设计之一全局解释器锁线程APIsthreading.active_count()threading.current_thread()threading.excepthook(args,/)threading.get_native_id()threading.main_thread()threading.stack_size([size])线程对象成员函数构造器start/ru
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
python tif转png Python与遥感 python 开发语言
importosfromosgeoimportgdalimportnumpyasnpfromPILimportImage#提取432三波段fromspectralimport*#输入文件夹路径defget_img(dataset_img):width=dataset_img.RasterXSize#获取行列数height=dataset_img.RasterYSizebands=dataset_i
python怎么将png转为tif_png转tif weixin_39977276
发国外的文章要求图片是tif，cmyk色彩空间的。大小尺寸还有要求。比如网上大神多，找到了一段代码，感谢！https://www.jianshu.com/p/ec2af4311f56https://github.com/KevinZc007/image2Tifimportjava.awt.image.BufferedImage;importjava.io.File;importjava.io.Fi
python批量读取tiff文件_Python Pillow批量转换tif格式到jpg weixin_39557797
最近因为想要整下网站的壁纸，从网站下载了别人整理好的合集压缩包，解压之后，却发现里面的文件都是tif的，tif格式网站和电脑都不认的，根本不能作壁纸。这时候，就需要转换图片格式了，首先我找了几款转换格式的软件，发现效果都不好，要不是不支持tif格式，要不就是转换出来的图片糊的不行。最终，还是决定用Python的Pillow库来写一个脚本，完成这个任务。下面是整个的小脚本----importosim
react-intl——react国际化使用方案苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
国际化介绍i18n：internationalization国家化简称，首字母+首尾字母间隔的字母个数+尾字母，类似的还有k8s(Kubernetes)React-intl是React中最受欢迎的库。使用步骤安装#usenpmnpminstallreact-intl-D#useyarn项目入口文件配置//index.tsximportReactfrom"react";importReactDOMf
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
Spring Boot中实现跨域请求 BABA8891 spring boot 后端 java
在SpringBoot中实现跨域请求（CORS，Cross-OriginResourceSharing）可以通过多种方式，以下是几种常见的方法：1.使用@CrossOrigin注解在SpringBoot中，你可以在控制器或者具体的请求处理方法上使用@CrossOrigin注解来允许跨域请求。在控制器上应用：importorg.springframework.web.bind.annotation.
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
GenVisR 基因组数据可视化实战(三) 11的雾
3.genCov画每个突变位点附件的coverage，跟igv有点相似。这个操作起来很复杂，但是图还是挺有用的。可以考虑。由于我的referencegenomebuild是hg38BiocManager::install(c("TxDb.Hsapiens.UCSC.hg38.knownGene","BSgenome.Hsapiens.UCSC.hg38"))library(TxDb.Hsapien
COCO 格式的数据集转化为 YOLO 格式的数据集 QYQY77 YOLO python
"""--json_path输入的json文件路径--save_path保存的文件夹名字，默认为当前目录下的labels。"""importosimportjsonfromtqdmimporttqdmimportargparseparser=argparse.ArgumentParser()parser.add_argument('--json_path',default='./instances
python结束子进程_如何清除python中的子进程 weixin_39995943 python结束子进程
我们使用python进程来管理长时间运行的python子进程。有时需要终止子进程。kill命令不会完全终止进程，只会使其失效。运行以下脚本将演示此行为。importsubprocessp=subprocess.Popen(['sleep','400'],stdout=subprocess.PIPE,shell=False)或者p=subprocess.Popen('sleep400',stdout
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option