shenzi

Windows核心编程：内存映射文件

作者：shenzi

链接：http://blog.csdn.net/shenzi

Windows核心编程：内存映射文件

与虚拟内存相似，内存映射文件允许开发人员预定一块地址空间区域并给区域调拨物理存储器。不同之处在于内存映射文件的物理存储器来自磁盘上已有的文件，而不是来自系统的页交换文件。一旦把文件映射到地址空间，我们就可以对它进行访问，就好像整个文件都已经在被载入内存一样。
内存映射主要用于以下三种情况：

系统使用内存映射文件来载入并运行.exe和动态链接库（DLL）。这大量节省了页交换文件的空间以及应用程序启动的时间。
开发人员可以使用内存映射文件来访问磁盘上的数据文件。这使得我们可以避免直接对文件进行I/O操作和对文件内容进行缓存。
通过使用内存映射文件，我们可以在同一台机器的不同进程间共享数据。Windows的确提供了其它一些方法来在进程间传送数据，但这些方法都是通过内存映射文件来实现的。因此，如果在同一台机器的不同进程之间共享数据，内存映射文件时最高效的方法。

1.映射到内存的可执行文件和DLL
当一个线程在调用CreateProcess的时候，系统会执行以下步骤：

系统会先确定CreateProcess所指定的可执行文件所在的位置。如果无法找到该.exe文件，那么系统将不会创建进程，这时CreateProcess会返回FALSE.
系统创建一个新的进程内核对象。
系统为新进程创建一个私有地址空间。
系统预定一块足够大的地址空间来容纳.exe。待预定的地址空间区域的具体位置已经在.exe文件中指定。默认情况下，.exe文件的基地址是0x00400000。但是，只需在构建应用程序的.exe文件时使用/BASE连接器开关，我们就可以给自己的应用程序指定一个不同的地址。
系统会对地址空间区域进行标注，表明该区域的后备物理存储器来自磁盘上的.exe文件，而并非来自系统的页交换文件。

当系统把.exe文件映射到进程的地址空间之后，会访问.exe文件中一个段，这个段列出了一些DLL文件，它们包含该.exe文件调用到的函数。然后系统会调用LoadLibrary来载入每个DLL，如果哪个DLL需要用到其它DLL，那么系统同样会调用其它DLL，那么系统同样会调用 LoadLibrary来载入相应的DLL。系统每次调用LoadLibrary来载入DLL的时候，执行的操作与刚才列出的后两步相似。

系统会预定一块足够大的地址空间区域来容纳DLL文件。待预定的的地址空间区域的具体位置已经在DLL文件中指定。所有与Windows一起发布的系统DLL都有不同的基地址，这样即使把它们载入到同一个地址空间，也不会发生重叠。
如果系统无法在DLL文件指定的基地址处预定区域，这可能是因为该区域已经被另一个DLL或.exe占用，也可能是区域不够大，这时系统会尝试在另一个地址来为DLL预定地址空间区域。如果DLL不包含重定位信息（当使用连接器的/FIXED开关来构建DLL），这意味着DLL必须被载入到指定的基地址，否则无法被载入。如果对DLL执行重定位，重定位不仅需要占用页交换文件中额外的存储空间，而且会增加载入DLL所需的时间。
系统会对地址空间区域进行标注，表明该区域的后备物理存储器来自磁盘上的DLL文件，而并非来自页交换文件。如果由于Windows不能将DLL载入到指定的基地址而必须重定位的话，那么系统还会另外进行标注，表明DLL中有一部分物理存储器映射到了页交换文件。

   把所有的.exe文件和DLL文件都映射到进程的地址空间之后，系统会开始执行.exe文件的启动代码。当完成对.exe文件的映射后，系统会负责所有的换页（paging）、缓存（buffering）、以及高速缓存（caching）操作。
同一个可执行文件或DLL的多个实例不会共享静态数据
    如果一个应用程序已经在运行，那么当我们为这个应用程序创建一个新的进程时，系统只不过是打开另一个内存映射试图（memory-mapped view），创建一个新的进程对象，并为主线程创建一个新的线程对象。这个新打开的内存映射视图隶属一个文件映射对象（file-mapping object），后者用来标识可执行文件的映像。系统同时给进程对象和线程对象分别制定新的进程ID和线程ID。通过使用内存映射文件，同一个应用程序的多个实例可以共享内存中的代码和数据。
   下图是一个简单的视图，它描述了如何把应用程序中的代码和数据载入到虚拟内存，并将它们映射到地址空间中。

假设应用程序的第二个实例现在开始运行。这时系统只不过是把包含应用程序代码和数据的虚拟内存页面映射到第二个实例的地址空间中，如下图所示：

如果一个应用程序的一个实例修改了数据页面中的一些全局变量，那么有用程序所有实例的内容都会被修改。由于这种类型的修改可能会导致灾难性的结构，因此必须避免。
系统通过内存管理器的写时保护（copy-on-write）特性来防止这种情况的发生。任何时候当应用程序试图写入内存映射文件的时候，系统会首先截获此类尝试，接着为应用程序试图写入的内存页面分配一块新的内存，然后复制页面内容，最后让应用程序写入到刚分配的内存块。下图描述了当应用程序的第一个实例试图修改数据页面2中的一个全局变量时，会产生怎样的结果：

   系统先分配了一页新的虚拟内存（New page）,然后把数据页面2中的内容复制到新压面中。系统会更新第一个实例的地址空间，这样新的数据页面就会和原始数据页面一样，映射到进程地址空间中的同一位置。现在系统不仅可以让进程修改全局变量的值，而且也不用担心会修改到同一个应用程序的其它实例的数据了。
    说明：当系统创建一个进程时，会检查文件映像的所有页面。对那些通常需要用写时复制属性进行保护的页面，系统会立即从页交换文件中调拨存储器。但系统只是调拨这些页面，而不会实际载入页面的内容。当程序访问到文件映像中的一个页面时，系统会载入相应的页面。如果该页从未修改过，那么可以舍弃其中的内容并在需要时重新载入。但如果文件映像的该页面被修改过，那么系统必须把修改过的页面调换到页交换文件中。
在同一个可执行文件或DLL的多个实例间共享静态数据
    默认情况下，同一个.exe文件或DLL的多个实例之间不会共享全局或静态数据，这样的设计是最保险的。但是，有些情况下在同一个.exe文件或DLL的多个实例之间共享同一个变量不仅有用，而且方便。
   每个.exe文件或DLL文件映像由许多段组成。按照惯例，每个标准的段名称都以点号开始。

表1：可执行文件常用段

段命	目的
.bss	未经初始化的数据
.CRT	只读的C运行时数据
.data	已初始化的数据
.debug	调试信息
.didata	延迟导入的名字表（Delay imported names table）
.edata	导出的名字表（Exported names table）
.idata	导入的名字表（Imported names table）
.rdata	只读的运行时数据（Read-only run-time data）
.reloc	重定位表信息（Relocation table information）
.rsrc	资源（Resources）
.text	.exe文件或DLL的代码（.exe's or DLL's code）
.textbss	当启用增量链接（Incremental Linking）选项时，由C++编译器生成
.tls	线程本地存储（Thread-local storage）
.xdata	异常处理表（Exception-handling table）

每个段都有与之相关联的属性，如表2所示：

表2：段的属性

属性	含义
READ	可以从该段读取数据
WRITE	可以从该段写入数据
EXECUTE	可以执行该段的内容
SHARED	该段的内容为多个实例所共享 (这个属性事实上关闭了写时复制机制)

    除了使用编译器和连接器所创建的标准段之外，我们还可以在编译的时候使用下面的编译器指示符来创建自己的段：
   #pragma data_seg("sectionname")
   举个例子，我们可以用下面的代码来创建一个名为“Shared”的段，它只包含一个LONG变量：
   #pragma data_seg("Shared")
   LONG g_lInstanceCount;
   #pragma data_seg()
   需要谨记的极其重要的一点是，编译器只会将已初始化的变量保存在这个段中。
   Visual C++编译器也提供了一个allocate说明符，它允许我们将未经初始化的数据放到任何我们想要放的段中。
   下面的例子显示用法：
   // Create Shared section & have compiler place initialized data in it.
   #pragma data_seg("Shared")
   // Initialized, in Shared section
   int a = 0;
   // Uninitialized, not in Shared section
   int b;
   // Have compiler stop placing initialized data in Shared section.
   #pragma data_seg()
   // Initialized, in Shared section
   __declspec(allocate("Shared")) int c = 0;
   // Uninitialized, in Shared section
   __declspec(allocate("Shared")) int d;
   // Initialized, not in Shared section
   int e = 0;
   // Uninitialized, not in Shared section
   int f;
2.映射到内存的数据文件
   Windows操作系统使我们能够把数据文件映射到进程的地址空间中，这样以来，对大型数据流进行操控就非常容易。
    颠倒文件内容的例子，四种方法的比较。。。
   内存映射文件方法：
   使用内存映射文件来颠倒文件内容时，我们先打开文件并向系统预定一块虚拟地址空间区域。接着让系统把文件的第一个字节映射到该区域的第一个字节。然后就可以访问这块虚拟内存区域，就好像它实际上包含了文件一样。事实上，如果颠倒得是一个文本文件，而且文件末尾的字节为0，则可以把这个文件当作内存中的一个字符串来处理，在这种情况下，直接调用C运行库函数_tcsrev就能颠倒文件中的数据。
   这种方法的最大优点在于让系统为我们处理所有与文件缓存有关的操作。我们不必再分配分配任何内存，把文件中的数据载入内存，把数据写回文件、以及释放内存块。但如果操作过程被中断，仍然可能导致数据被破坏。
3.使用内存映射文件
    要使用内存映射文件，需要执行下面三个步骤：
   （1）创建或打开一个文件内核对象，该对象标识了我们想要用作内存映射文件的那个磁盘文件。
    （2）创建一个文件映射内核对象（file-mapping kernel object）来告诉系统文件的大小以及我们打算如何访问文件。
    （3）告诉系统把文件映射对象的部分或全部映射到进程的地址空间中。
   用完内存映射文件之后，必须执行下面三个步骤来做清理工作：
    （1）告诉系统从进程地址空间中取消对文件映射内核对象的映射。
    （2）关闭文件映射内核对象。
    （3）关闭文件内核对象。
第1步：创建或打开文件内核对象
    我们总是通过调用CreateFile函数来创建或打开一个文件内核对象：
    HANDLE CreateFile(
   PCSTR pszFileName,
   DWORD dwDesiredAccess,
   DWORD dwShareMode,
   PSECURITY_ATTRIBUTES psa,
   DWORD dwCreationDisposition,
   DWORD dwFlagsAndAttributes,
   HANDLE hTemplateFile);
    在创建或打开一个作为内存映射文件来使用的文件时，应该根据我们打算如何访问文件来选择一个或一组最合适的标志。对内存映射文件来说，必须以只读方式或读/写方式来打开文件，因此我们可以为 dwDesiredAccess 相应地使用GERERIC_READ或GENERIC_READ | GENERIC_WRIITE。
第2步：创建文件映射内核对象
   调用CreateFile是为了告诉操作系统文件映射的物理存储器所在的位置。传入的路径是文件在磁盘上所在的位置，文件映射对象的物理存储器来自该文件。现在我们必须告诉系统文件映射对象需要多大的物理存储器。为了达到这一目的，必须调用CreateFileMapping：
   HANDLE CreateFileMapping(
   HANDLE hFile,
   PSECURITY_ATTRIBUTES psa,
   DWORD fdwProtect,
   DWORD dwMaximumSizeHigh,
   DWORD dwMaximumSizeHigh ,
   PCTSTR pszName);
    hFile 是需要映射到进程地址空间的文件的句柄。该句柄时前面调用CreateFile的时候返回的。
    psa 是一个指向SECURITY_ATTRIBUTES结构的指针，一般来说传NULL就可以了。
    fdwProtect 指定保护属性。
    dwMaximumSizeHigh ， dwMaximumSizeHigh 告诉系统内存映射文件的最大大小，以字节为单位。如果想要用当前的文件大小创建一个文件映射对象，那么只要穿0给这两个参数就可以了。
第3步：将文件的数据映射到进程的地址空间
    在创建了文件映射对象之后，还需要为文件的数据预定一块地址空间区域并将文件的数据作为物理存储器调拨给区域。 这可以通过调用MapViewOfFile来实现：
    PVOID MapViewOfFile(
   HANDLE hFileMappingObject,
   DWORD dwDesiredAccess,
   DWORD dwFileOffsetHigh,
   DWORD dwFileOffsetLow,
   SIZE_T dwNumberOfBytesToMap);
    hFileMappingObject 是文件映射对象的句柄，它是之前调用CreateFileMapping或OpenFileFMapping函数时返回的。
   dwDesiredAccess 表示想要如何访问数据。

保护属性	含义
FILE_MAP_WRITE	可以读取和写入文件。在调用 CreateFileMapping 时必须传 PAGE_READWRITE 保护属性。
FILE_MAP_READ	可以读取文件。在调用 CreateFileMapping 时可以传 PAGE_READONLY 或 PAGE_ READWRITE 保护属性。
FILE_MAP_ALL_ACCESS	等同于 FILE_MAP_WRITE \| FILE_MAP_READ \| FILE_MAP_ COPY .
FILE_MAP_COPY	可以读取和写入文件。写入操作会导致系统为该页面创建一份副本。在调用CreateFileMapping 时必须传 PAGE_WRITECOPY 保护属性。
FILE_MAP_EXECUTE	可以将文件中的数据作为代码来执行。在调用 CreateFileMapping 时可以传PAGE_EXECUTE_READWRITE 或PAGE_EXECUTE_READ 保护属性。

   剩下的三个参数与预定区域和给区域调拨物理存储器有关。当我们把一个文件映射到进程的地址空间中的时候，不必一下子映射整个文件。可以每次只把文件的一小部分映射到地址空间中。文件中被映射到进程地址空间中的部分被称为试图（view）。
   把文件的一个视图映射到进程地址空间中时，必须告诉系统两件事情。第一，必须告诉系统应该把数据文件中的哪个字节映射到试图中的第一个字节。这是通过参数 dwFileOffsetHigh ， dwFileOffsetLow 来指定的。第二，必须告诉系统要把数据文件中的多少映射到地址空间中去。参数 dwNumberOfBytesToMap 用来指定大小。如果指定的大小为0，系统会试图把文件中从偏移量开始到文件末尾的所有部分都映射到试图中。
第4步：从进程的地址空间撤销对文件数据的映射
    不再需要把文件的数据映射到进程的地址空间中时，可以调用下面的函数来释放内存区域：
   BOOL UnmapViewOfFile(PVOID pvBaseAddress);
    这个函数唯一的参数 pvBaseAddress 用来指定区域的基地址，它必须和MapViewOfFile的返回值相同。确定调用UnmapViewOfFile，如果不这样做，在进程终止之前，区域将得不到释放。
   出于速度上的考虑，系统会对文件数据的页面进行缓存处理，这样在处理文件映射试图的时候就不需要随时更新磁盘上的文件。如果需要确保所做的修改已经被写入到磁盘中，那么可以调用FlushViewOfFile，这个函数用来强制系统把部分或全部修改过的数据写回到磁盘中：
   BOOL FlushViewOfFile(
   PVOID pvAddress,
   SIZE_T dwNumberOfBytesToFlush);
    第一个参数是内存映射文件的视图中第一个字节的地址。函数会把传入的地址向下取整到页面大小的整数倍。第二个参数表示想要刷新的字节数。系统会把这个数值向上取整，使总的字节数称为页面大小的整数倍。
   UnmapViewOfFile 有个特征需要牢记。如果视图最初是用FILE_MAP_COPY标志映射的，那么对文件数据的任何修改实际上是对保存在页交换文件中的数据副本的修改。如果在这种情况下调用UnmapViewOfFile，函数不需要对磁盘文件进行任何更新，但它会释放页交换文件中的页面，从而导致数据丢失。如果希望保留修改过的数据，必须自己进行额外的操作。
第5步和第六步：关闭文件映射对象和文件对象
    不用说，我们必须关闭自己打开的任何内核对象，不然会在进程继续运行的过程中引起资源泄漏。
   HANDLE hFile = CreateFile(...);
   HANDLE hFileMapping = CreateFileMapping(hFile, ...);
   PVOID pvFile = MapViewOfFile(hFileMapping, ...);

   // Use the memory-mapped file.

   UnmapViewOfFile(pvFile);
   CloseHandle(hFileMapping);
   CloseHandle(hFile);
4.用内存映射文件来处理大文件
    如何将一个16EB的文件映射到一个较小的地址空间中？
    一开始，我们只映射文件开头的部分到视图中，完成对文件的第一个视图的访问后，我们可以撤销对文件这一部分的远射，然后把文件的另一部分映射到视图中。我们一直重复这个过程，直到完成对整个文件的访问。
5.内存映射文件和一致性
    系统允许我们把同一个文件中的数据映射到多个视图中。只要我们映射的是同一个文件映射对象，那么系统会确保各视图中的数据是一致的。这是因为即使该页面被多次映射到进程的虚拟地址空间中，系统也还是在同一个内存页面中保存被映射的数据。如果多个进程把同一个数据文件映射到多个视图中，那么数据也仍然会是一致的，这是因为数据文件中的每个页面在内存中只有一份——但这些内存页面会被映射到多个进程的地址空间中。
   说明：Windows允许我们以同一个数据文件为后备存储器来创建多个文件映射对象。Windows并不保证这些不同的文件映射对象的各个视图是一致的。系统只保证在同一文件映射对象的多个视图间保持一致。
6.给内存映射文件制定基地址
    在调用VirtualAlloc的时候，我们可以建议系统在指定的基地址预定地址空间。同样，也可以用MapViewOfFileEx函数来代替MapViewOfFile函数，这样就能建议系统把文件映射到指定的地址：
   PVOID MapViewOfFileEx(
   HANDLE hFileMappingObject,
   DWORD dwDesiredAccess,
   DWORD dwFileOffsetHigh,
   DWORD dwFileOffsetLow,
   SIZE_T dwNumberOfBytesToMap,
   PVOID pvBaseAddress);
    除了最后一个参数 pvBaseAddress ，这个函数的所有参数和返回值都与MapViewOfFile函数完全相同。我们可以用这个参数来给要映射的文件制定一个目标地址。同VirtualAlloc函数一样，指定的目标地址必须是分配粒度的整数倍。
    使用内存映射文件跨进程共享数据的时候，MapViewOfFileEx非常有用。给共享的数据文件在不同的进程指定相同的基地址。
7.内存映射文件的实现细节
    在进程能够从自己的地址空间中访问内存映射文件的数据之前，Windows要求进程先调用MapViewOfFile。不同进程调用MapViewOfFile时返回的内存地址，很可能是不同的。
8.用内存映射文件在进程间共享数据
    Windows提供了多种机制，使得应用程序之间能够快速、方便地共享数据和信息。在Windows中，在同一台机器上共享数据的最底层的机制就是内存映射文件。
    让我们来看一个例子：启动应用程序。当一个应用程序启动时，系统会先调用CreateFile来打开磁盘上的.exe文件。接着系统会调用 CreateFileMapping来创建文件映射对象。最后系统会以新创建的进程的名义调用MapViewOfFileEx（并传入SEC_IMAGE 标志），这样就把.exe文件映射到了进程的地址空间中。值所以调用MapViewOfFileEx而不是MapViewOfFile，是为了把文件映射到指定的基地址，这个基地址保存在.exe的PE文件头中。系统然后创建进程的主线程，在映射得到的视图中取得可执行代码的第一个字节的地址，把该地址放到线程的指令指针中，最后让CPU开始执行其中的代码。
   如果用户启动同一个应用程序的第二个实例，那么系统会发现该.exe文件已经有一个文件映射对象，因此就不会再创建一个新的文件对象或文件映射对象。取而代之的是，系统会再次映射.exe文件的一个视图，但这次是在新创建的进程的地址空间中。至此，系统已经把同一个文件同时映射到了两个地址空间中。显然，由于物理内存中包含.exe文件可执行代码的那些页面为两个进程所共享，因此内存的使用率更高。
9.以页交换文件为后备存储器的内存映射文件
    Microsoft加入了相应的支持，让系统能够创建以页交换文件为后备存储器的内存映射文件，这样就不需要用磁盘上专门的文件来作为后备存储器了。这种方法和为磁盘文件创建内存映射文件的方法几乎完全相同，甚至更简单。一方面，由于不必创建或打开一个专门的磁盘文件，因此不需要调用CreateFile。我们只需要像原来那样调用CreateFileMapping，并将INVALID_HANDLE_VALUE作为hFile参数传入。这告诉系统我们创建的文件映射对象的物理存储器不是磁盘上的文件，而是希望系统从页交换文件中调拨物理存储器。所需分配的存储器大小由CreateFileMapping的dwMaximumSizeHigh和dwMaximumSizeLow参数决定。

单片机开发过程中经常会遇到什么问题？好好学习的不知名程序员学习单片机
开发过程中经常遇到的问题包括数值异常、动作异常以及程序崩溃等。具体如下：1.数值异常问题及其解决方法数组越界：数组越界是一种常见的问题，当数组的索引超出了其实际范围时，可能会导致相邻变量的值被错误地修改。解决这类问题通常需要结合内存映射文件（map文件），通过分析map文件找到可能的不安全代码，并将其修正为安全代码。例如，确保对数组的访问都在有效的索引范围内。栈溢出：栈溢出也是数值异常的一个典型例
面试（九）低调包含不哈哈面试准备嵌入式面试操作系统 C语言
目录一.僵尸进程/孤儿进程/守护进程二线程的同步和异步三.线程间通信3.1共享内存3.2互斥锁3.3条件变量3.4信号量3.5读写锁3.6事件3.7线程局部存储四.进程间通信3.1管道3.2消息队列3.3.共享内存3.4信号量3.5套接字3.6内存映射文件3.7信号五.字节对齐六.内存分配的方式七.智能指针八.常见的内存错误及对策一.僵尸进程/孤儿进程/守护进程僵尸进程：进程已经完成执行，但其父进
计算机基础知识复习8.9 我叫啥都行计算机基础知识 java 开发语言后端笔记 jvm
什么是零拷贝是一种内存映射文件的方法，即将一个文件或者其他对象映射到进程的地址空间，实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对映关系。就是内核缓冲区和应用缓冲区共享，从而减少了从读缓冲区到用户缓冲区的一次CPU拷贝StringStringBuilderStringBuffer使用String是不可变的，StringBuilder与StringBuffer都继承自AbstractStr
文件元数据，内存映射文件 Moving on395 c语言 vim linux ubuntu bash
文件元数据文件元数据的获取#includeintstat(charconst*path,structstat*buf)；intfstat(intfd,structstat*buf);intlstat(charconst*path,structstat*buf);->功能:从i节点中提取文件的元数据，即文件的属性信息->参数:path文件路径buf文件元数据结构fd文件描述符->返回值:成功返回0，
内存映射文件（Memory-Mapped Files）在Java中的应用详解大骨熬汤 java 开发语言
内存映射文件（Memory-MappedFiles）在Java中的应用详解目录引言内存映射文件的基本概念什么是内存映射文件？内存映射文件与直接内存读取的区别内存映射文件的优势性能提升低内存开销并发访问与共享内存简化文件I/O操作内存映射文件的挑战内存管理复杂性线程安全问题平台依赖性文件大小限制典型使用场景大文件处理与解析数据库系统中的应用文件缓存与快速访问进程间通信与共享内存游戏开发中的资源管理J
Java应用Memory Mapped Files机制吴代庄 Java java linux
Java中利用MemoryMappedFiles（内存映射文件）机制进行顺序写操作是一种高效的文件处理方式，特别是在处理大文件时。这种技术允许我们将文件的一部分或全部映射到内存中，从而可以直接通过内存地址来访问文件内容，而不是通过传统的文件I/O操作。基本原理内存映射文件的核心思想是操作系统提供的一种将文件内容映射到进程地址空间的机制。这意味着应用程序可以通过内存地址来访问文件数据，而不需要使用系
内存映射mmap函数的理解不掉头发的程序猿_ Linux学习笔记 linux
定义：mmap，从函数名就可以看出来这是memorymap,即地址的映射,是一种内存映射文件的方法。mmap：将一个文件或者其它对象映射到进程的地址空间，实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对映关系。mmap()系统调用使得进程之间通过映射同一个普通文件实现共享内存。普通文件被映射到进程地址空间后，进程可以向访问普通内存一样对文件进行访问，不必再调用read()，write（）等
Numpy使用详解正经龙
Numpy（NumericalPython的简称）时高性能科学计算和数据分析的基础包，提供了矩阵运算的功能。相关链接Numpy官方推荐教程Numpy具有以下几点能力：ndarry——一个具有向量算数运算和复杂广播能力的多位数组对象用于对数组数据进行快速运算的标准数学函数用于读写磁盘数据的工具以及用于操作内存映射文件的工具非常有用的线性代数，傅立叶变换和随机数操作用于继承c/c++和Fortran代
bert+np.memap+faiss文本相似度匹配 topN 木下瞳 NLP 机器学习深度学习模型 bert faiss 人工智能
目录任务代码结果说明任务使用bert-base-chinese预训练模型将文本数据向量化后，使用np.memap进行保存，再使用faiss进行相似度匹配出每个文本与它最相似的topN此篇文章使用了地址数据，目的是为了跑通这个流程，数据可以自己构建模型下载：bert预训练模型下载-CSDN博客np.memap：是NumPy库中的一种内存映射文件（Memory-MappedFile）对象，它允许你将硬
NIO_通道的数据传输与内存映射文件 Shaw_Young
packagecom.young.nio.day01;importorg.junit.Test;importjava.io.FileInputStream;importjava.io.FileOutputStream;importjava.io.IOException;importjava.nio.ByteBuffer;importjava.nio.MappedByteBuffer;importj
《Windows核心编程》若干知识点应用实战分享 dvlinker C/C++技术分享 Windows核心编程虚拟内存分区多线程汇编代码死锁检测 DLL延迟加载与远程注入 SEH异常与C++异常
目录1、进程的虚拟内存分区与小于0x10000的小地址内存区1.1、进程的虚拟内存分区1.2、小于0x10000的小地址内存区2、保存线程上下文的CONTEXT结构体3、从汇编代码角度去理解多线程运行过程的典型实例4、调用TerminateThread强制结束线程会导致线程中的资源没有释放的问题5、调用WaitForSingleObject监测目标程序有没有退出5.1、WaitForSingleO
linux教程：vm.max_map_count参数详解学亮编程手记 Linux linux
vm.max_map_count是一个与内核虚拟内存子系统相关的参数，用于控制进程可以拥有的内存映射区域的最大数量。它通常用于限制一个进程可以打开的文件数量，特别是在使用大量内存映射文件的情况下。在Linux系统上，vm.max_map_count参数的默认值通常是较小的数值，例如65530。然而，对于一些需要大量内存映射的应用程序或者特定的使用场景，可能需要增加该参数的值，以便支持更多的内存映射
mmap的原理琥珀川白
函数定义mmap是一种内存映射文件的方法，即将一个文件或者其它对象映射到进程的地址空间，实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对映关系。函数原型void*mmap(void*start,size_tlength,intprot,intflags,intfd,off_toffset);start：映射区的开始地址，设置0时表示由系统决定映射区的起始地址。length：映射区的长度。/
C# MemoryMappedFiles卡死问题 wangyue4 c#
在C#中，MemoryMappedFiles（内存映射文件）是用于在多个进程间共享大量数据的一种高效机制。然而，在使用过程中可能会遇到卡死或者无响应的问题，这通常与以下几个方面有关：同步问题：多个线程或进程同时访问内存映射文件的同一区域时如果没有适当的同步控制，可能导致数据竞争或死锁。解决方案：确保在对内存映射文件进行读写操作时正确使用锁或其他同步原语（如Mutex、Semaphore或.NET的
【C#笔记整理】-内存共享是小明同学呀 c#开发语言 java
C#中的内存共享（SharedMemory）1.dotNet共享内存的原理在.net中是通过操作系统系统的内存管理器来进行操作的，管理器会自动将共享内存文件分页，并根据需要对其进行访问。不需要手动去处理内存管理。2.内存映射文件2.1什么是内存映射文件内存映射文件允许你保留一块地址空间，然后将物理存储映射到这块内存空间中进行操作。物理存储有文件系统管理；内存映射文件是操作系统级内存管理。内存映射文
c# 操作共享内存 wangyue4 c#java 前端
在C#中操作共享内存，通常采用内存映射文件（Memory-MappedFiles）技术实现进程间的通信。内存映射文件允许不同进程访问同一物理内存区域，这样多个进程间就可以通过共享内存来高效地交换大量数据。以下是一个简单的C#操作共享内存的示例：usingSystem;usingSystem.IO;usingSystem.IO.MemoryMappedFiles;usingSystem.Thread
【Java难点攻克】「NIO和内存映射性能提升系列」彻底透析NIO底层的内存映射机制原理与Direct Memory的关系洛神灬殇
NIO与内存映射文件Java类库中的NIO包相对于IO包来说有一个新功能就是【内存映射文件】，在业务层面的日常开发过程中并不是经常会使用，但是一旦在处理大文件时是比较理想的提高效率的手段，之前已经在基于API和开发实战角度介绍了相关的大文件读取以及NIO操作的实现，而本文主要想结合操作系统(OS)底层中相关方面的内容进行分析原理，夯实大家对IO模型及操作系统相关的底层知识体系。下图就是Java应用
谈谈内存映射文件 hwlfly OS microsoft 内存映射文件
转自：http://blog.csdn.net/ithzhang/article/details/7001650内存映射文件允许开发人员预订一块地址空间并为该区域调拨物理存储器，与虚拟内存不同的是，内存映射文件的物理存储器来自磁盘中的文件，而非系统的页交换文件。将文件映射到内存中后，我们就可以在内存中操作他们了，就像他们被载入内存中一样。内存映射文件主要有三方面的用途：1：系统使用内存映射文件来将
虚拟内存与内存映射文件区别与联系 hwlfly OS 操作系统内存管理
转自：http://blog.sina.com.cn/s/blog_4eee98350100abbr.html虚拟内存与内存映射文件是操作系统内存管理的重要部分，二者有相似也有不同的地方，本文是作者学习与应用中得到的一些体会，有错误的地方，请提点。二者的联系：虚拟内存与内存映射文件都是将一部分内容加载的内存，另一部分放在磁盘（硬盘）上的一种机制。二者都是应用程序动态性的基础。由于二者的虚拟性，对于
《Windows核心编程》笔记（一）拉普拉斯妖kk
字符及字符串处理UTF-16将每个字符编码为2个字节（或者说16位）。UTF-8将一些字符编码为1个字节，一些字符编码为2个字节，一些字符编码为3个字节，一些字符编码为4个字节。UTF-32将每个字符都编码为4个字节。C运行库中现有的字符串处理函数，在应用程序中包含StrSafe.h时，String.h也会包含进来。比如_tcscpy宏背后的那些函数，已标记为废弃不用。如果使用了这些函数，编译时就
存储框架-MMKV-mmap高性能技术的运用 momxmo
一、简介MMKV是基于mmap内存映射的key-value组件，底层序列化/反序列化使用protobuf实现，性能高，稳定性强。SharedPreferences的替代者，考虑到这个防crash方案最主要的诉求还是实时写入，而mmap内存映射文件刚好满足这种需求，我们尝试通过它来实现一套key-value组件。mmap技术研究，建议先看一下二、原理①内存准备：通过mmap内存映射文件，提供一段可供
重新认识 Java 中的内存映射（mmap） zhexiao27 JAVA java jvm 开发语言
mmap基础概念mmap是一种内存映射文件的方法，即将一个文件映射到进程的地址空间，实现文件磁盘地址和一段进程虚拟地址的映射。实现这样的映射关系后，进程就可以采用指针的方式读写操作这一段内存，而系统会自动回写脏页到对应的文件磁盘上，即完成了对文件的操作而不必再调用read,write等系统调用函数。相反，内核空间对这段区域的修改也直接反映用户空间，从而可以实现不同进程间的文件共享。mmap工作原理
什么叫内存映射文件 ruanjianxueyuan113 Java后端
内存映射文件什么是虚拟内存内存映射怎么工作什么是虚拟内存引入虚拟内存之后，对于每一个进程，操作系统提供一种假象，让每个进程感觉自己拥有一个巨大的连续的内存可以使用，这个虚拟的空间甚至还可以比内存的容量还大。这个“假象”就是虚拟地址空间。虚拟地址是面向每个进程的，只是一个“假象”罢了。此时CPU使用虚拟地址向内存寻址，通过专用的内存管理单元（MMU）硬件把虚拟地址转换为真实的物理地址（地址翻译），操
MMKV 数据存储(零拷贝技术) Mr_Leixiansheng android
MMKV是基于mmap内存映射的key-value组件，底层序列化/反序列化使用protobuf实现，性能高，稳定性强。从2015年中至今在微信上使用，其性能和稳定性经过了时间的验证。近期也已移植到Android/macOS/Win32/POSIX平台，一并开源。MMKV原理内存准备通过mmap内存映射文件，提供一段可供随时写入的内存块，App只管往里面写数据，由操作系统负责将内存回写到文件，不必
操作系统笔记——储存系统、文件系统（王道408）亦梦亦醒乐逍遥计算机体系结构个人随笔/学习笔记笔记系统架构考研
文章目录前言储存系统地址转换内存扩展覆盖交换储存器分配——连续分配固定大小分区动态分区分配动态分区分配算法储存器分配——非连续分配页式管理基本思想地址变换硬件快表（TLB）多级页表段式管理段页式管理虚拟储存器——基于交换的内存扩充技术基本概念请求分页页面置换算法页面分配策略、抖动、工作集内存映射文件文件管理概述目录结构文件目录的概念文件目录结构索引节点文件结构文件结构分类逻辑结构顺序文件索引文件索
C#多进程通信之共享内存方式 rztyfx c#开发语言
共享内存方式应该最简单易用的直接上代码,下面列出了2种,一种是映射视图,一种是映射流,任选一种即可服务端:MemoryMappedFilememoryAccessor=MemoryMappedFile.CreateNew("ProcessCommunicationAccessor",500,MemoryMappedFileAccess.ReadWrite);//创建共享内存映射文件对象，第一个参数
Boost.Interprocess 官方文档学习笔记东方不常败 c++开发语言
共享内存通常是进程间通信的最快形式。它提供了一个在进程之间共享的内存区域。一个进程可以向该区域写入数据，另一个进程可以读取数据。促进Interprocess简化了常见进程间通信和同步机制的使用，并提供了多种机制：共享内存。内存映射文件。信号量、互斥量、条件变量和可升级的互斥量类型，以将它们放置在共享内存和内存映射文件中。这些同步对象的命名版本，类似于UNIX/Windows的sem_open/Cr
Boost.Interprocess使用手册翻译之六：同步机制（Synchronization mechanisms）章志强 C/C++
六．同步机制同步机制概述互斥量条件变量信号量升级互斥量通过移动语义转移锁文件锁消息队列同步机制概述具名和匿名同步机制同步机制类型如前所述，如果对内存的访问不能有效的同步，则通过内存映射文件或共享内存对象在进程间共享内存的能力就不是非常有用了。与需要在进程间共享堆栈和全局变量的进程间同步机制遇到的问题一样，访问这些资源一般需要使用互斥量或条件变量进行同步。Boost.Threads在同一进程的线程间
《Windows核心编程》笔记（一）拉普拉斯妖1228 Windows c++windows 操作系统
字符及字符串处理UTF-16将每个字符编码为2个字节（或者说16位）。UTF-8将一些字符编码为1个字节，一些字符编码为2个字节，一些字符编码为3个字节，一些字符编码为4个字节。UTF-32将每个字符都编码为4个字节。C运行库中现有的字符串处理函数，在应用程序中包含StrSafe.h时，String.h也会包含进来。比如_tcscpy宏背后的那些函数，已标记为废弃不用。如果使用了这些函数，编译时就
Windows核心编程 HOOK 貌美不及玲珑心，贤妻扶我青云志 Windows核心编程 windows C++
目录HOOK概述HOOKAPISetWindowsHookExA函数(winuser.h)UnhookWindowsHookEx函数(winuser.h)NextHookEx函数(winuser.h)局部钩子全局钩子为什么全局钩子需要用dll作为过程函数？HOOK概述本质：Windows消系统的消息过滤器。全局钩子原理：将自己的dll注入到别的进程。并不是一开始就注入所有程序。钩子种类：局部钩子：
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

Windows核心编程：内存映射文件

作者：shenzi

链接：http://blog.csdn.net/shenzi

你可能感兴趣的:(Windows核心编程：内存映射文件)