平凡的思想者

windows底层内存管理技术

1.1. 物理地址

在物理存储器上的内存地址，一般由内核管理，应用程序无法直接得到。

1.2. 虚拟地址

在进程私有空间中的地址，即应用程序指针所指向的地址值。

1.3. 寻址空间

进程所能够范围的地址空间范围，跟指针的位数有关，指针的位数取决于cpu字长，32位指针的地址空间范围为4GB，64位指针的地址空间范围为1 6 E B。

2. windows内存结构

2.1. 虚拟地址空间的管理

对于32位多任务的windows操作系统来说，每个进程都在自己的私有地址空间（虚拟地址空间）运行，因此当进程中的一个线程正在运行时，该线程可以访问只属于它的进程的内存。属于所有其他进程的内存则隐藏着，并且不能被正在运行的线程访问。

在win2k中，属于内核的内存也是隐藏的，正在运行的线程无法访问。这意味着线程不能直接访问内核的数据。如果要想访问内核数据，则必须通过系统调用（系统win32 api）来操作，否则会引发一个内存错误异常。

Win98中，属于操作系统的内存是不隐藏的，正在运行的线程可以访问。因此，正在运行的线程常常可以访问操作系统的数据，也可以破坏操作系统（从而有可能导致操作系统崩溃）。

在Win98中，一个进程的线程不可能访问属于另一个进程的内存，与win2k相同。

建议无论在win98还是win2k中，都采用系统调用来访问内核（操作系统内存）。

2.2. 虚拟地址空间的划分

虽然32位的应用程序理论上可以访问4GB的地址空间，但是真正可以使用的地址空间并没有那么多。

每个进程的虚拟地址空间都要划分成各个分区。地址空间的分区是根据操作系统的基本实现方法来进行的。不同的Windows内核，其分区也略有不同。winxp的内存结构与win2k相同。

进程的地址空间分区表

分区	32位Windows 2000(x86和Alpha处理器)	32位Windows 2000(x86w/3GB用户方式)	64位Windows 2000(Alpha和IA-64处理器)	Windows 98
N U L L指针分配的分区	0 x 0 0 0 0 0 0 0 0 0 x 0 0 0 0 F F F F	0 x 0 0 0 0 0 0 0 0 0 x 0 0 0 0 F F F F	0x00000000 00000000 0x00000000 0000FFFF	0 x 0 0 0 0 0 0 0 0 0 x 0 0 0 0 0 F F F
DOS/16位Windows应用程序兼容分区	无	无	无	0 x 0 0 0 0 0 1 0 0 0 0 x 0 0 3 F F F F F
用户方式	0 x 0 0 0 1 0 0 0 0 0 x 7 F F E F F F F	0 x 0 0 0 1 0 0 0 0 0 x B F F E F F F F F	0x00000000 00010000 0x000003FF FFFEFFFF	0 x 0 0 4 0 0 0 0 0 0 x 7 F F F F F F F
64-KB	0 x 7 F F F 0 0 0 0	0 x B F F F 0 0 0 0	0 x 0 0 0 0 0 3 F F F F F F 0 0 0 0	无
禁止进入	0 x 7 F F F F F F F	0 x B F F F F F F F	0 x 0 0 0 0 0 3 F F F F F F F F F F	无
共享的MMF分区	无	无	无	0 x 8 0 0 0 0 0 0 0
文件(MMF)内核方式	0 x 8 0 0 0 0 0 0 0 0 0 x F F F F F F F F	0 x C 0 0 0 0 0 0 0 0 x F F F F F F F F	0x00000400 00000000 0xFFFFFFFFF FFFFFFF	0 x B F F F F F F F 0 x C 0 0 0 0 0 0 0 0 x F F F F F F F F

3 2位Windows 2000的内核与6 4位Windows 2000的内核拥有大体相同的分区，差别在于分区的大小和位置有所不同。另一方面，可以看到Windows 98下的分区有着很大的不同。

NULL指针分配的分区：为了帮助程序员掌握N U L L指针的分配情况。如果你的进程中的线程试图读取该分区的地址空间的数据，或者将数据写入该分区的地址空间，那么C P U就会引发一个访问违规。保护这个分区是极其有用的，它可以帮助你发现N U L L指针的分配情况。一般的c/c++编译器都把NULL设置为0，落在这个分区中。

MS-DOS/16位Windows应用程序兼容分区（仅适用Win98）：进程地址空间的这个4MB分区是Windows 98需要的，目的是维护MS - DOS应用程序与16位应用程序之间的兼容性。不应该试图从32位应用程序来读取该分区的数据，或者将数据写入该分区。在理想的情况下，如果进程中的线程访问该内存， CPU应该产生一个访问违规，但是由于技术上的原因， Microsoft无法保护这个4MB的地址空间。

在Windows 2000中，16位MS-DOS与16位Windows应用程序是在它们自己的地址空间（其实是在虚拟机中）中运行的，32位应用程序不会对它们产生任何影响。

16位DOS程序的虚拟机就是cmd，16位windows程序使用的是系统虚拟机。

用户方式分区：这个分区是进程的私有（非共享）地址空间所在的地方。

在Windows 2000中，所有的. e x e和DLL模块均加载这个分区。每个进程可以将这些D L L加载到该分区的不同地址中（不过这种可能性很小）。系统还可以在这个分区中映射该进程可以访问的所有内存映射文件。

在Windows 98中，主要的Win32系统DLL（Kernel32.dll，AdvAPI32.dll，User32.dll和GDI32.dll）均加载共享内存映射文件分区中。. e x e和所有其他D L L模块则加载到这个用户方式分区中。多个进程的共享D L L均位于相同的虚拟地址中，但是其他DLL可以将这些D L L加载到用户方式分区的不同地址中（不过这种可能性不大）。另外，在Windows 98中，用户方式分区中决不会出现内存映射文件。

在32位windows中，用户分区的最大寻址空间大约为2G，内核寻址空间为3G。M i crosof t允许x 8 6的Windows 2000 Advanced Server版本和Windows 2000 Data Center版本将用户方式分区扩大为3 G B，内核分区压缩为1G。若要使所有进程都能够使用3 G B用户方式分区和1 G B内核方式分区，必须将/ 3 G B开关附加到系统的BOOT. INI文件的有关项目中。

在x86w/3GB和64位的windows中，若要使用2GB以上的用户空间，该应用程序必须使用/ LARGEADDRESSAWARE 链接开关来创建。

64KB禁止进入的分区（适用于win2k）：这个位于用户方式分区上面的64 KB分区是禁止进入的，访问该分区中的内存的任何企图均将导致访问违规。

共享的MMF分区（适用于win98）：存放系统DLL、进程共享数据和内存映射文件。

内核方式分区：存放内核代码。用于线程调度、内存管理、文件系统支持、网络支持和所有设备驱动程序的代码全部在这个分区加载。驻留在这个分区中的一切均可被所有进程共享。

在Windows 2000中，这些组件是完全受到保护的。如果你试图访问该分区中的内存地址，你的线程将会产生访问违规，导致系统向用户显示一个消息框，并关闭你的应用程序。

在Windows 98中该分区中的数据是不受保护的。任何应用程序都可以从该分区读取数据，也可以写入数据，因此有可能破坏操作系统。

2.3. 地址空间的区域

当进程被创建并被赋予它的地址空间时，该可用地址空间的主体是空闲的，即未分配的。若要使用该地址空间的各个部分，必须通过调用VirtualAlloc函数来分配它里边的各个区域。对一个地址空间的区域进行分配的操作称为保留( reserving )。

每当你保留地址空间的一个区域时，系统要确保该区域从一个分配粒度的边界开始。对于不同的CPU平台来说，分配粒度是各不相同的。几乎所有的CPU平台（x86、32位Alpha、64位Alpha和IA-64）都使用64 KB这个相同的分配粒度。

当你保留地址空间的一个区域时，系统还要确保该区域的大小是系统的页面大小的倍数。页面是系统在管理内存时使用的一个内存单位。与分配粒度一样，不同的C P U，其页面大小也是不同的。x86使用的页面大小是4 KB，而A l p h a使用的页面大小则是8 KB。IA-64也使用8KB的页面。但是，如果测试显示使用更大的页面能够提高系统的总体性能，那么Microsoft可以切换到更大的页面（16KB或更大）。

系统有时会直接代表进程保留一些区域，比如用来存放进程环境块PEB和线程环境块TEB。

由于内核会做区域和页面管理，所以它给应用程序保留的区域边界可能不是64k边界。

如果保留区域大小不是页面大小的整数倍，则会圆整到比它大的最近的页面倍数。比如，在x86平台上页面大小为4K，申请保留10k内存时，系统会保留12K内存给你。

不再使用保留区域时，应该调用VirtualFree来释放。

保留区域并不真正分配物理内存，只是占用进程的地址空间而已。

如果要分配物理页面，必须通过调用VirtualAlloc函数来提交保留区域。

2.4. 物理内存与页文件

Windows虚拟内存是映射到磁盘上的页文件。页文件对应用程序透明。页面调度算法在内核中实现。

虚拟内存的管理需要cpu和内核配合，cpu会判断内存页面是否在RAM中，否则会引发一个缺页中断通知操作系统内核，内核再进行页面调度，根据某种算法淘汰、调入和调出页面。

操作系统启动一个.exe文件时，把.exe文件本身作为一个页文件处理（内存映射文件），这样就大大减少了系统页文件的大小。

把系统页文件分散到不同的磁盘分区中，这样可以提高读写效率。

注意软盘上的应用程序是一次性映射到物理内存的，因为安装程序时经常需要更换软盘。

2.5. 数据对齐

数据对齐主要和cpu和编译器有关，跟操作系统关系不大。

当CPU访问正确对齐的数据时，它的运行效率最高。当数据大小的数据模数的内存地址是0时，数据是对齐的。例如， W O R D值应该总是从被2除尽的地址开始，而D W O R D值应该总是从被4除尽的地址开始，如此等等。当C P U试图读取的数据值没有正确对齐时， CPU可以执行两种操作之一。即它可以产生一个异常条件，也可以执行多次对齐的内存访问，以便读取完整的未对齐数据值。

数据对齐更深入的说明，请查看另一篇文档《深入研究字节对齐问题》。

2.6. 内存管理的几种方法

windows提供了3种进行内存管理的方法，它们是：

• 虚拟内存，以页面为单位进行内存，最适合用来管理大型对象或结构数组。

• 内存映射文件，最适合用来管理大型数据流（通常来自文件）以及在单个计算机上运行的多个进程之间共享数据。

• 内存堆栈，最适合用来管理大量的小对象。

malloc、new、allocator等内存管理是在应用程序的标准库中处理的，不属于操作系统内存管理的范围，故本文不做探讨，在其他文档中再做论述。

3. 进程堆栈

3.1. 简介

堆栈可以用来分配许多较小的数据块。

堆栈的优点是，可以不考虑分配粒度和页面边界之类的问题，集中精力处理手头的任务。堆栈的缺点是，分配和释放内存块的速度比其他机制要慢，并且无法直接控制物理存储器的提交和回收。

从内部来讲，堆栈是保留的地址空间的一个区域。开始时，保留区域中的大多数页面没有被提交物理存储器。当从堆栈中进行越来越多的内存分配时，堆栈管理器将把更多的物理存储器提交给堆栈。物理存储器总是从系统的页文件中分配的，当释放堆栈中的内存块时，堆栈管理器将收回这些物理存储器。

Microsoft并没有以文档的形式来规定堆栈释放和收回存储器时应该遵循的具体规则，Windows 98 与Windows 2000的规则是不同的。可以这样说，Windows 98 更加注重内存的使用，因此只要可能，它就收回堆栈。Windows 2000更加注重速度，因此它往往较长时间占用物理存储器，只有在一段时间后页面不再使用时，才将它返回给页文件。Microsoft常常进行适应性测试并运行各种不同的条件，以确定在大部分时间内最适合的规则。随着使用这些规则的应用程序和硬件的变更，这些规则也会有所变化。如果了解这些规则对你的应用程序非常关键，那么请不要使用堆栈。相反，可以使用虚拟内存函数（即VirtualAlloc和VirtualFree），这样，就能够控制这些规则。

3.2. 默认堆栈

当进程初始化时，系统在进程的地址空间中创建一个堆栈。该堆栈称为进程的默认堆栈。按照默认设置，该堆栈的地址空间区域的大小是1 MB。但是，系统可以扩大进程的默认堆栈，使它大于其默认值。当创建应用程序时，可以使用/ H E A P链接开关，改变堆栈的1 M B默认区域大小。/ H E A P链接开关的句法如下：/HEAP:reserve[,commit]

单个进程可以同时拥有若干个堆栈。这些堆栈可以在进程的寿命期中创建和撤消。但是，默认堆栈是在进程开始执行之前创建的，并且在进程终止运行时自动被撤消。不能撤消进程的默认堆栈。

可以通过调用GetProcessHeap函数获取你的进程默认堆栈的句柄。

3.3. 辅助堆栈

由于某种原因需要创建辅助堆栈：

保护组件。

更加有效地进行内存管理。

更快的访问效率。

减少线程同步的开销。

迅速释放。

3.3.1. 保护组件

把不同组件放到不同的堆栈中，可以防止当一个组件的堆栈出错时影响另外一个组件。假设有两个组件，一个处理链表数据，一个处理二叉树数据，把它们放到不同的辅助堆栈中，当链表内的指针错误操作导致堆栈出错不会影响到二叉树的正确处理。

3.3.2. 更有效的内存管理

通过在堆栈中分配同样大小的对象，就可以更加有效地管理堆栈，这样可以避免内存碎片。

如果每个堆栈只包含大小相同的对象，那么释放一个对象后，另一个对象就可以恰好放入被释放的对象空间中。

3.3.3. 更快的访问效率

如果把相同类型的数据连续放在同一个堆中，这样就可以大大减少cpu访问不同页面的次数，也可能大大减少访问虚拟内存页面的次数，因此会获得更佳的内存访问效率。

3.3.4. 减少线程的开销

多个线程访问进程的默认堆栈是串行操作的，要经常不停的同步互斥操作。如果某个线程的数据不需要与其他线程进行共享，则没有必要和其他线程竞争默认堆栈的访问权。此时创建线程自己的堆栈，可以减少不必要的加锁、解锁开销。

3.3.5. 迅速释放

将专用堆栈用于某些数据结构后，就可以释放整个堆栈，而不必显式释放堆栈中的每个内存块。比如把某个树的数据结构放到一个独立的堆栈中，释放这个树的数据结果就不用一个个节点的慢慢释放，直接撤销堆即可。如果这个树的数据比较大的话，效果会比较明显。

3.4. 堆栈函数

创建堆栈使用HeapCreate，从堆栈中分配内存HeapAlloc，改变堆栈内存大小HeapReAlloc，查询堆栈内存块大小HeapSize，释放堆栈内存块HeapFree，撤销堆栈HeapDestroy。

HeapAlloc函数执行的操作：

1) 遍历分配的和释放的内存块的链接表。

2) 寻找一个空闲内存块的地址。

3) 通过将空闲内存块标记为“已分配”并分配内存块。

4) 将新内存块添加给内存块链接表。

注意当你分配较大的内存块（大约1 MB或者更大）时，最好使用VirtualAlloc函数，应该避免使用堆栈函数。

以上堆栈函数适用于win98和win2k。

C++中的new/delete要调用malloc/free，而malloc/free最终要调用上面的堆栈函数。

ToolHelp的各个函数可以用来枚举进程的各个堆栈和这些堆栈中分配的内存块。函数如下：Heap32First、Heap32Next、Heap32ListFirst和Heap32ListNext，适用于win98和win2k。

以下堆栈函数只适用于win2k：GetProcessHeaps（获取进程多个堆栈的句柄）、HeapValidate（验证堆栈完整性）、HeapCompact（合并空闲地址块）、HeapLock/HeapUnlock（线程对堆栈加锁/解锁，如果在创建堆栈时未设置HEAP_NO_SERIALIZE，则在HeapAlloc和HeapFree时内部加锁）、HeapWalk（遍历堆栈，此时最好加锁，防止有其他线程分配或释放内存）。

4. 线程堆栈

4.1. windows 2000线程堆栈

每当创建一个线程时，系统就会为线程的堆栈（每个线程有它自己的堆栈）保留一个堆栈空间区域，并将一些物理存储器提交给这个已保留的区域。

按照默认设置，系统保留1 MB的地址空间并提交两个页面的内存。但是，这些默认值是可以修改的，方法是在你链接应用程序时设定Microsoft的链接程序的/STACK选项：/STACK:reserve[,commit]。

当创建一个线程的堆栈时，系统将会保留一个链接程序的/ STACK开关指明的地址空间区域。但是，当调用CreateThread或_beginthreadex函数时，可以重设原先提交的内存数量。这两个函数都有一个参数，可以用来重载原先提交给堆栈的地址空间的内存数量。如果设定这个参数为0，那么系统将使用/ S TACK开关指明的已提交的堆栈大小值，即1 MB的保留区域，每次提交一个页面的内存。

下图显示了在页面大小为4KB的计算机上的一个堆栈区域的样子(保留的起始地址是0x08000000) 。该堆栈区域和提交给它的所有物理存储器均拥有页面保护属性PAGE_READWRITE。

当保留了这个区域后，系统将物理存储器提交给区域的顶部的两个页面。在允许线程启动运行之前，系统将线程的堆栈指针寄存器设置为指向堆栈区域的最高页面的结尾处（一个非常接近0x08100000的地址）。这个页面就是线程开始使用它的堆栈的位置。从顶部向下的第二个页面称为保护页面。当线程调用更多的函数来扩展它的调用树状结构时，线程将需要更多的堆栈空间。

可以看出栈是向下增长的。

每当线程试图访问保护页面中的存储器时，系统就会得到关于这个情况的通知。作为响应，系统将提交紧靠保护页面下面的另一个存储器页面。然后，系统从当前保护页面中删除保护页面的保护标志，并将它赋予新提交的存储器页面。这种方法使得堆栈存储器只有在线程需要时才会增加。最终，如果线程的调用树继续扩展，堆栈区域就会变成下图所示的样子。

假定线程的调用树非常深，堆栈指针C P U寄存器指向堆栈内存地址0 x 0 8 0 0 3 0 0 4。这时，当线程调用另一个函数时，系统必须提交更多的物理存储器。但是，当系统将物理存储器提交给0 x 0 8 0 0 1 0 0 0地址上的页面时，系统执行的操作与它给堆栈的其他内存区域提交物理存储器时的操作并不完全一样。

最底下的页面总是被保留的，从来不会被提交。

完整的线程堆栈区域

当系统将物理存储器提交给0x08001000地址上的页面时，它必须再执行一个操作，即它要引发一个EXCEPTION_STACK_OVERFLOW 异常处理（在Wi nNT.h 文件中定义为0 x C00000FD）。通过使用结构化异常处理（SEH），你的程序将能得到关于这个异常处理条件的通知，并且能够实现适度恢复。

如果在出现堆栈溢出异常条件之后，线程继续使用该堆栈，那么在0 x080010 0 0地址上的页面中的全部内存均将被使用，同时，该线程将试图访问从0 x 0 8 0 0 0 0 0 0开始的页面中的内存。当该线程试图访问这个保留的（未提交的）内存时，系统就会引发一个访问违规异常条件。如果在线程试图访问该堆栈时引发了这个访问违规异常条件，线程就会陷入很大的麻烦之中。这时，系统就会接管控制权，并终止进程的运行—不仅终止线程的运行，而切终止整个进程的运行。

最后一个页面始终被保留着。这样做的目的是为了防止不小心改写进程使用的其他数据。

4.2. windows 98线程堆栈

在win98上，线程的堆栈前后都有一个64K的保护区块，可以防止线程堆栈的上溢和下溢，这是win98的一个不错的特色。

堆栈下溢的示例：

int WINAPI WinMain(HINSTANCE hinstExe, HINSTANCE,

PSTR pszCmdLine, int nCmdShow)

{

char szBuf[100];

szBuf[10000] = 0; // Stack underflow，注意栈是向下增长的（与地址相反）

return(0);

}

当该函数的赋值语句执行时，便尝试访问线程堆栈结尾处之外的内存。当然，编译器和链接程序不会抓住上面代码中的错误，但是，如果应用程序是在Windows 98下运行，那么当该语句执行时，就会引发访问违规。这是Windows 98的一个出色特性，而Windows 2000是没有的。在Wi ndows2000中，可以在紧跟线程堆栈的后面建立另一个区域。如果出现这种情况，并且你试图访问你的堆栈外面的内存，那么你将会破坏与进程的另一个部分相关的内存，而系统将不会发现这个情况。

4.3. c/c++运行库线程堆栈检查

C / C + +运行期库包含一个堆栈检查函数。当编译源代码时，编译器将在必要时自动生成对该函数的调用。堆栈检查函数的作用是确保页面被适当地提交给线程的堆栈。

示例代码：

void SomeFunction()

{

int nValues[4000];

// Do some processing with the array.

nValues[0] = 0; // Some assignment

}

该函数至少需要16 000个字节（4000 x sizeof(int),每个整数是4个字节）的堆栈空间，以便放置整数数组。通常情况下，编译器生成的用于分配该堆栈空间的代码只是将C P U的堆栈指针递减16 000个字节。但是，在程序试图访问内存地址之前，系统并不将物理存储器分配给堆栈区域的这个较低区域。

在使用4 KB或8 KB页面的系统上，这个局限性可能导致一个问题出现。如果初次访问堆栈是在低于保护页面的一个地址上进行的（如上面这个代码中的赋值行所示），那么线程将访问已经保留的内存并且引发访问违规。为了确保能够成功地编写上面所示的函数，编译器将插入对C运行期库的堆栈检查函数的调用。

当编译程序时，编译器知道你针对的C P U系统的页面大小。x 8 6编译器知道页面大小是4K B，A l p h a编译器知道页面大小是8 KB。当编译器遇到程序中的每个函数时，它能确定该函数需要的堆栈空间的数量。如果该函数需要的堆栈空间大于目标系统的页面大小，编译器将自动插入对堆栈检查函数的调用。

下面这个伪代码显示了堆栈检查函数执行什么操作。之所以称它是伪代码，是因为这个函数通常是由编译器供应商用汇编语言来实现的：

// The C run-time library knows the page size for the target system.

#ifdef _M_ALPHA

#define PAGESIZE (8 * 1024) //8-KB page

#else

#define PAGESIZE (4 * 1024) //4-KB page

#endif

void StackCheck(int nBytesNeededFromStack)

{

//Get the stack pointer position.

//At this point, the stack pointer has NOT been decremented

//to account for the function's local variables.

PBYTE pbStackPtr = (CPU's stack pointer);

while(nBytesNeededFromStack >= PAGESIZE)

{

// Move down a page on the stack--should be a guard page.

pbStackPtr -= PAGESIZE;

// Access a byte on the guard page--forces new page to be

// committed and guard page to move down a page.

pbStackPtr[0] = 0;

// Reduce the number of bytes needed from the stack.

nBytesNeededFromStack -= PAGESIZE;

}

//Before returning, the StackCheck function sets the CPU's

//stack pointer to the address below the function's

//local variables.

}

5. 虚拟内存管理

注意：我们这里说的虚拟内存指的是进程私有地址空间，而不是页文件（也有把页文件称为操作系统的虚拟内存）。

用于管理虚拟内存的函数可以用来直接保留一个地址空间区域，将物理存储器（来自页文件）提交给该区域，并且可以设置你自己的保护属性。

5.1. 获取系统内存信息

系统内存信息，比如页面的大小，分配粒度大小、最小内存地址、最大内存地址等，都可以通过GetSystemInfo来获取。

函数原型：VOID GetSystemInfo(LPSYSTEM_INFO psinf);

5.2. 获取全局内存状态

可以通过GlobalMemoryStatus来获取全局内存状态，比如整体物理内存大小、整体页文件大小、进程虚拟内存大小、进程可用虚拟内存大小等。

函数原型：VOID GlobalMemoryStatus(LPMEMORYSTATUS pmst);

5.3. 查询内存块的有关信息

可以通过VirtualQuery/ VirtualQueryEx查询内存块的有关信息，如基地址、块大小，存储器类型和保护属性等。

5.4. 保留和提交虚拟内存

通过VirtualAlloc可以保留或提交一块虚拟内存空间。

保留的基地址被圆整为64K的整数倍，保留的大小为cpu页面大小的整数倍。如果内存长期被保留不释放，建议从最高地址往下分配，这样可以把内存碎片放在用户空间的末尾，此时需要在分配类型上设置或参数MEM_TOP_DOWN。

当保留一个区域后，必须将物理存储器提交给该区域，然后才能访问该区域中包含的内存地址。

系统从它的页文件中将已提交的物理存储器分配给一个区域。物理存储器总是按页面边界和页面大小的块来提交的。

若要提交物理存储器，必须再次调用VirtualAlloc函数。

提交物理存储器时可以只提交部分区域，每次提交的页面保护属性页可以不同。提交的大小（单位为字节）会被操作系统圆整为页面大小的整数倍。

把分配类型设置为MEM_RESERVE | MEM_COMMIT就可以保留并提交一块虚拟内存空间。

5.5. 何时提交和回收虚拟内存

对于大块不确定内存操作，可以先保留一个足够大的内存区域，在需要时再提交物理内存，这样可以节省大量的物理内存。

提交方式有以下4种：

1、总是提交。每次都调用VirtualAlloc提交物理内存，让操作系统来判断是否已经提交，这样可能会导致大量的无效调用，因为该页面很可能已经提交过。

2、提交前查询。先调用VirtualQuery查询一下该内存块是否被提交，然后决定是否调用VirtualAlloc。此方法只是减少了VirtualAlloc调用次数，效率可能比第一种还低。

3、跟踪提交页面。把已经提交的页面都记录起来，每次需要新内存时先看已经提交的页面是否有足够内存可用，否则调用VirtualAlloc提交物理内存。此方法效率较高，但是代码可能比较复杂。

4、使用结构化异常处理（SEH）。但进程试图写一个未提交的保留页面时，系统会触发一个内存违规异常，在内存违规异常处理函数中提交物理内存，然后系统返回到异常触发点处继续执行指令，就好像什么都没有发生。此方法代码清晰，效率很高，推荐使用。

使用VirtualFree可以回收全部的保留页面（包括提交和未提交的），也可以只回收部分物理页面。

物理页面回收的3种方法：

1、对象大小为页面的整数倍。删除对象时直接回收相应的页面。

2、把每个页面放置固定数目的对象。当页面中所有的对象都删除时，回收该页面。

3、低优先级定时回收。定时检查每个页面中的所有对象是否都释放，如果是则回收该页面，这种做法的好处是比较通用，而且可以在进程比较空闲时执行，缺点是代码相对复杂。

5.6. 改变页面保护属性和复位内存页面

可以通过VirtualProtect来改变内存保护属性。例如，你编写了一个用于管理链接表的代码，将它的节点存放在一个保留区域中。可以设计一些函数，以便处理该链接表，这样，它们就可以在每个函数开始运行时将已提交内存的保护属性改为PAGE_READWRITE ，然后在每个函数终止运行时将保护属性重新改为PAGE_NOACCESS。

通过这样的设置，就能够使链接表数据不受隐藏在程序中的其他错误的影响。如果进程中的任何其他代码存在一个迷失指针，试图访问你的链接表数据，那么就会引发访问违规。当试图寻找应用程序中难以发现的错误时，利用保护属性是极其有用的。

可以通过在VirtualAlloc中设置MEM_RESET可以复位内存页面，这些页面会被操作系统设置为未修改页面，这样在下次缺页中断时就可以直接把页面文件的页面加载到这些未修改页面上，而不需要保存它们到页文件中去。

5.7. 如何使用4G以上内存

1）在64位的cpu上安装64位windows可以直接支持4G以上内存的访问。

2）32位操作系统4G内存以上支持情况：

WindowsNT4.0 Server与Enterprise版都属于32位服务器操作系统，支持最大内存都只有4G。

Windows2000系列服务器版操作系统可支持容量最高的是数据中心版，可支持32G；高级服务器版只支持最高8G的内存容量；2000普通服务器版只支持最高4G的内存容量。

Windows2003 Enterprise支持最高32G的内存。

在32位cpu上访问4G以上内存,这是通过X86的PAE（Intel Physical Address Extension）实现的。而windows实现起来的话相当与把内存分页,页表12位,物理地址24 位,组合在一起就是2的36次方,也就是64GB。

PAE需要处理器为Intel Pentium Pro以上。

在cpu和操作系统支持的情况下，应用程序可以通过AWE来使用4G以上内存。

6. 内存映射文件

6.1. 基本概念

与虚拟内存一样，内存映射文件可以用来保留一个地址空间的区域，并将物理存储器提交给该区域。它们之间的差别是，物理存储器来自一个已经位于磁盘上的文件，而不是系统的页文件。一旦该文件被映射，就可以访问它，就像整个文件已经加载内存一样。

6.2. 用途

内存映射文件可以用于3个不同的目的：

• 系统使用内存映射文件，以便加载和执行.exe和DLL文件。这可以大大节省页文件空间和应用程序启动运行所需的时间。

• 可以使用内存映射文件来访问磁盘上的数据文件。这使你可以不必对文件执行I/O操作，并且可以不必对文件内容进行缓存。

• 可以使用内存映射文件，使同一台计算机上运行的多个进程能够相互之间共享数据。Windows确实提供了其他一些方法，以便在进程之间进行数据通信，但是这些方法都是使用内存映射文件来实现的，这使得内存映射文件成为单个计算机上的多个进程互相进行通信的最有效的方法。

6.3. 可执行程序和DLL的内存映射

可执行文件内存映射过程：

1) 系统找出在调用CreateProcess时设定的.exe文件。如果找不到这个.exe文件，进程将无法创建，CreateProcesss将返回FALSE。

2) 系统创建一个新进程内核对象。

3) 系统为这个新进程创建一个私有地址空间。

4) 系统保留一个足够大的地址空间区域，用于存放该.exe文件。该区域需要的位置在. e x e文件本身中设定。按照默认设置， .exe文件的基地址是0x00400000（这个地址可能不同于在6 4位Windows 2000上运行的6 4位应用程序的地址），但是，可以在创建应用程序的. exe文件时重载这个地址，方法是在链接应用程序时使用链接程序的/BASE选项。

5) 系统注意到支持已保留区域的物理存储器是在磁盘上的.exe文件中，而不是在系统的页文件中。

当.exe文件被映射到进程的地址空间中之后，系统将访问.exe文件的一个部分，该部分列出了包含.exe文件中的代码要调用的函数的DLL文件。然后，系统为每个DLL文件调用LoadLibrary函数，如果任何一个DLL需要更多的DLL，那么系统将调用LoadLibrary函数，以便加载这些DLL。

DLL内存映射过程：

1) 系统保留一个足够大的地址空间区域，用于存放该D L L文件。该区域需要的位置在D L L文件本身中设定。按照默认设置， Microsoft的Visual C++ 建立的DLL文件基地址是0 x 10000000（这个地址可能不同于在64位Windows 2000上运行的64位DLL的地址）但是，你可以在创建DLL文件时重载这个地址，方法是使用链接程序的/BASE选项。Windows提供的所有标准系统DLL都拥有不同的基地址，这样，如果加载到单个地址空间，它们就不会重叠。

2) 如果系统无法在该DLL的首选基地址上保留一个区域，其原因可能是该区域已经被另一个DLL或.exe占用，也可能是因为该区域不够大，此时系统将设法寻找另一个地址空间的区域来保留该DLL。如果一个DLL无法加载到它的首选基地址，这将是非常不利的，原因有二。首先，如果系统没有再定位信息，它就无法加载该DLL（可以在DLL创建时，使用链接程序的/FIXED开关，从DLL中删除再定位信息，这能够使DLL变得比较小，但是这也意味着该DLL必须加载到它的首选地址中，否则它就根本无法加载）。第二，系统必须在DLL中执行某些再定位操作。在Windows 98中，系统可以在页面被转入RAM时执行再定位操作。在Windows 2000中，这些再定位操作需要由系统的页文件提供更多的存储器，它们也增加了加载DLL所需要的时间量。

3) 系统会记录当前DLL是映射到磁盘文件还是系统的页文件中。

当所有的.exe和DLL文件都被映射到进程的地址空间之后，系统就可以开始执行.exe文件的启动代码。当.exe文件被映射后，系统将负责所有的分页、缓冲和高速缓存的处理。例如，如果.exe文件中的代码使它跳到一个尚未加载到内存的指令地址，那么就会出现一个异常（缺页中断）。系统能够捕捉这个异常，并且自动将这页代码从该文件的映像加载到一个RAM页面。然后，系统将这个RAM页面映射到进程的地址空间中的相应位置，并且让线程继续运行，就像这页代码已经加载了一样。当然，这一切对应用程序透明。

所有的.exe和DLL映射文件的内容被分割为不同的节。代码放在一个节中，全局变量放在另一个节中。各个节按照页面边界来对齐。通过调用Get SystemInfo函数，应用程序可以确定正在使用的页面的大小。在. e x e或D L L文件中，代码节通常位于数据数据节的前面。

多个进程的.exe或DLL映射文件采用写时拷贝的方法共享RAM和页文件，这样可以避免修改全局变量时对不同进程的影响。

6.4. 可执行程序或DLL的不同示例共享静态数据

每个.exe或DLL文件的映像都由许多节组成。按照规定，每个标准节的名字均以圆点开头。例如，当编译你的程序时，编译器会将所有代码放入一个名叫.text的节中。该编译器还将所有未经初始化的数据放入一个.bss节，而已经初始化的所有数据则放入.data节中。

.exe或D L L文件分节的属性

属性	含义
READ	该节中的字节可以读取
WRITE	该节中的字节可以写入
EXECUTE	该节中的字节可以执行
SHARED	该节中的字节可以被多个实例共享（本属性能够有效地关闭copy -on-write机制）

编译器产生的标准节

节名	作用
.bss	未经初始化的数据
.CRT	C运行期只读数据
.data	已经初始化的数据
.debug	调试信息
.didata	延迟输入文件名表
.edata	输出文件名表
.idata	输入文件名表
.rdata	运行期只读数据
.reloc	重定位表信息
.rsrc	资源
.text	.exe或DLL文件的代码
.tls	线程的本地存储器
.xdata	异常处理表

要想在.exe或dll不同的实例间共享变量，必须满足以下3个条件：

1、创建分节。如：

#pragma data_seg("Shared")

LONG g_lInstanceCount = 0;

#pragma data_seg()

2、变量必须初始化，否则该变量就被放到其他分节中，达不到共享的目的。

如：#pragma data_seg("Shared")

LONG g_lInstanceCount；

#pragma data_seg()

3、必须把该分节设置为共享属性RWS。

可以在连接开关中设置CTION:Shared,RWS。

还可以在代码中设置：#pragma comment(linker, "/SECTION:Shared,RWS")。

如：

#pragma data_seg("Shared")

volatile LONG g_lApplicationInstances = 0;

#pragma data_seg()

#pragma comment(linker, "/Section:Shared,RWS")

虽然可以创建共享节，但是，由于两个原因， Microsoft并不鼓励你使用共享节。第一，用这种方法共享内存有可能破坏系统的安全。第二，共享变量意味着一个应用程序中的错误可能影响另一个应用程序的运行，因为它没有办法防止某个应用程序将数据随机写入一个数据块。

6.5. 内存映射数据文件

操作系统可以将一个数据文件映射到进程的地址空间中。这样，对大量的数据进行操作是非常方便的。

这种方法的最大优点是，系统能够为你管理所有的文件缓存操作。不必分配任何内存，或者将文件数据加载到内存，也不必将数据重新写入该文件，或者释放任何内存块。但是，内存映射文件仍然可能出现因为电源故障之类的进程中断而造成数据被破坏的问题。

若要使用内存映射文件，必须执行下列操作步骤：

1)使用CreateFile创建或打开一个文件内核对象，该对象用于标识磁盘上你想用作内存映射文件的文件。

2) 使用CreateFileMapping创建一个文件映射内核对象，告诉系统该文件的大小和你打算如何访问该文件。

3) 通过MapViewOfFile让系统将文件映射对象的全部或一部分映射到你的进程地址空间中。

当完成对内存映射文件的使用时，必须执行下面这些步骤将它清除：

1) 使用UnmapViewOfFile告诉系统从你的进程的地址空间中撤消文件映射内核对象的映像。

2) 使用CloseHandle关闭文件映射内核对象。

3) 使用CloseHandle关闭文件内核对象。

注意读写权限分配规则：CreateFile≥CreateFileMapping≥MapViewOfFile。这个可以理解，后者都是基于前者进行操作的，不能超越基础权限，另外给程序员带来了一定的灵活性。

另外，如果CreateFileMapping或MapViewOfFile设置了写时拷贝属性，则往映射的页面中写数据时，内核会在系统的页文件中创建新页面并把原始页面数据拷贝过来，然后把新创建的页面地址映射到进程的虚拟空间，并把新页面的属性被设置为读写属性，之后对数据的任何修改都是在私有页面上进行，对映射的数据文件没有任何影响。

注意：设置了写时拷贝属性的页面，在撤销内存文件映射时系统会回收物理页面，所有的修改都会丢失。

可以使用FlushViewOfFile强制系统把修改过的部分或全部页面数据写入数据文件，因为系统有自己的页面管理策略，可能不会马上把缓存数据写入数据文件。

Windows 98不支持写时拷贝属性。

6.6. 内存映射处理大文件

首先映射一个文件的开头的视图。当完成对文件的第一个视图的访问时，可以取消它的映像，然后映射一个从文件中的一个更深的位移开始的新视图。必须重复这一操作，直到访问了整个文件。这使得大型内存映射文件的处理不太方便，但是，幸好大多数文件都比较小，因此不会出现这个问题。

6.7. 内存映射与数据视图的相关性

相同内存映射对象的不同视图，如果它们有部分重叠，则重叠部分在进程的虚拟地址空间上有多个拷贝，但都对应于相同的物理页面，不浪费物理内存。这种情况对于同一进程或不同进程之间都是如此。

但是如果是相同文件的不同内存映射对象，则重叠部分的物理页面可能会重复加载，可能造成物理内存浪费。为什么说是可能，因为你虽然有重叠，但是如果你不访问重叠部分的文件页面，就不会加载到RAM。

如果CreateFile时没有阻止其他进程对这个文件的写访问，则有可能导致内存映射中RAM页面内容和原始文件不一致。

可以使用MapViewOfFileEx把文件内容映射到特定地址，只要地址是64k的整数倍。

关闭视图只是释放虚拟内存地址，并不释放物理页面，只有内存映射文件对象的引用计数为0时才释放物理页面。

6.8. 使用内存映射文件在多个进程间共享数据

尽管windows有多种进程间通信机制，如：RPC、COM、OLE、DDE、窗口消息（尤其是WM_COPYDATA）、剪贴板、邮箱、管道和套接字等。但是，在同一个主机上还是内存映射文件的效率最高。

内存映射可以使用普通磁盘文件，也可以使用系统页文件。如果只是共享和交换数据，使用磁盘文件很不方便，此时推荐使用系统页文件。

使用系统页文件就不用创建文件了，只需要像通常那样调用CreateFileMapping函数，并且传递INVALID_HANDLE_VALUE作为hFile参数即可，其他用法与磁盘文件相同。

与所有内核对象一样，可以使用3种方法与多个进程共享内存映射文件对象，这3种方法是句柄继承性、句柄命名和句柄复制。

采用句柄对象命名的方法可读性较好，推荐使用。在一个进程中调用CreateFileMapping创建内存映射文件对象，在另一个进程中使用OpenFileMapping打开内存映射文件对象，然后建立视图，分别映射文件的相同区块到自己的进程空间中就可以实现数据共享。

你可能感兴趣的:(windows开发,windows,dll,microsoft,编译器,存储,磁盘)

C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
如何用matlab灵活控制feko的求解 NingrLi matlab 开发语言
https://bbs.rfeda.cn/read.php?tid=3778Feko中的模型和求解设置等都可以通过editfeko进行设置，其文件存储为.pre文件，该文件可以用文本打开，因此，我们可以通过VB、VC、matlab等工具对.pre文件进行读写操作，以达到更灵活的使用feko。同样，对于.out文件，我们也可以进行读操作。熟练使用对.pre文件和.out文件的操作后，我们可以方便的计
利用python实现图片格式之间的相互转换难得北窗高卧 python 开发语言
一、概要图片一般有多种格式，常见的图片格式包括：JPEG（.jpg或.jpeg）：一种广泛使用的有损压缩格式，适用于摄影图像和网页上的图片。PNG（.png）：一种无损压缩格式，支持透明度和更好的图像质量，常用于图标、图形和需要透明背景的图片。该图片是4通道的，外加一个透明通道。如截屏GIF（.gif）：一种支持动画和透明度的格式，常用于简单的动画和图标。BMP（.bmp）：一种无损格式，存储图像
Python多线程实现大规模数据集高效转移 sand&wich 网络 python 服务器
背景在处理大规模数据集时，通常需要在不同存储设备、不同服务器或文件夹之间高效地传输数据。如果采用单线程传输方式，当数据量非常大时，整个过程会非常耗时。因此，通过多线程并行处理可以大幅提升数据传输效率。本文将分享一个基于Python多线程实现的高效数据传输工具，通过遍历源文件夹中的所有文件，将它们移动到目标文件夹。工具和库这个数据集转移工具主要依赖于以下Python标准库：os：用于文件系统操作，如
2023最详细的Python安装教程（Windows版本）程序员林哥 Python python windows 开发语言
python安装是学习pyhon第一步，很多刚入门小白不清楚如何安装python，今天我来带大家完成python安装与配置，跟着我一步步来，很简单，你肯定能完成。第一部分：python安装（一）准备工作1、下载和安装python(认准官方网站)当然你不想去下载的话也可以分享给你，还有入门学习教程，点击下方卡片跳转进群领取（二）开始安装对于Windows操作系统，可以下载“executableins
iPhone怎么删除重复照片，可以尝试这几种方法 2401_85240355 iphone ios
在数字化时代，智能手机尤其是iPhone成为我们日常生活中不可或缺的一部分。随着我们不断使用iPhone拍照，重复照片的积累逐渐成为一个普遍问题。这不仅占用了大量的存储空间，也使得照片库变得杂乱无章。本文将介绍几种有效的iPhone怎么删除重复照片方法，并介绍如何利用CleanMyPhone来简化这一过程。iPhone怎么删除重复照片方法一：人工筛查人工筛查是最直接的方法，尽管它可能比较耗时。这种
【树一线性代数】005入门 Owlet_woodBird 算法
Index本文稍后补全，推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141874376分析实现总结本文稍后补全，推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141874376已知非空二叉树T的结点值均为正整数，采用顺序存储方式保存，数据结构定义如下:t
python获取子进程返回值_Python对进程Multiprocessing子进程返回值 weixin_39752157 python获取子进程返回值
在实际使用多进程的时候，可能需要获取到子进程运行的返回值。如果只是用来存储，则可以将返回值保存到一个数据结构中；如果需要判断此返回值，从而决定是否继续执行所有子进程，则会相对比较复杂。另外在Multiprocessing中，可以利用Process与Pool创建子进程，这两种用法在获取子进程返回值上的写法上也不相同。这篇中，我们直接上代码，分析多进程中获取子进程返回值的不同用法，以及优缺点。初级用法
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
JavaScript `Map` 和 `WeakMap`详细解释跳房子的前端 JavaScript 原生方法 javascript 前端开发语言
在JavaScript中，Map和WeakMap都是用于存储键值对的数据结构，但它们有一些关键的不同之处。MapMap是一种可以存储任意类型的键值对的集合。它保持了键值对的插入顺序，并且可以通过键快速查找对应的值。Map提供了一些非常有用的方法和属性来操作这些数据对：set(key,value):将一个键值对添加到Map中。如果键已经存在，则更新其对应的值。get(key):获取指定键的值。如果键
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
MyBatis 详解阿贾克斯的黎明 java mybatis
目录目录一、MyBatis是什么二、为什么使用MyBatis（一）灵活性高（二）性能优化（三）易于维护三、怎么用MyBatis（一）添加依赖（二）配置MyBatis（三）创建实体类和接口（四）使用MyBatis一、MyBatis是什么MyBatis是一个优秀的持久层框架，它支持自定义SQL、存储过程以及高级映射。MyBatis免除了几乎所有的JDBC代码以及设置参数和获取结果集的工作。它可以通过简
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi