Linux系统调用mmap()api说明,这个系统函数在频繁读写文件是很高效。
mmap在调用进程内开辟一块内存空间,将文件(或文件部分)内容映射到调用的进程的虚拟空间中。进程通过操作这块mmap开辟的虚拟内存,就相当于直接操作文件本身了,其余的细节都由kernel,cpu中的mcu负责完成。这样与传统的I/O操作相比,不仅省去了写入I/O缓存,再有I/O写出的次数,还更加稳定可靠。
这篇文章主要尝试使用mmap进行频繁写文件操作尝试。
函数原型
void *mmap(void addr[.length], size_t length, int prot, int flags, int fd, off_t offset);
mmap()函数会在调用它进程的虚拟内存空间中创建一个映射。创建的映射开始地址是通过函数参数addr进行设定。参数length表示这个映射的长度(这个值必须大于0)。
如果addr的值是NULL,kernel会决定映射在虚拟内存中的创建起始地址,这也是创建映射最便捷的方式。
如果addr的不是NULL,kernel会根据addr值所表明的位置作为映射的起始地址(参数addr值不一定是最终的映射创建地址,kernel将其作为一个参考值,在其周边选择一个页边界地址开始创建映射。这个边界地址总是要大于**/proc/sys/vm/mmap_min_addr**的值)并尝试创建映射。
如果另一个映射已经存在于需要的地址上,kernel会选择在另一个新地址上创建映射,这个起始地址可能依赖于addr也可能于之无关,不依赖于这个参数地址值。
函数最终的返回值就是最终创建映射的起始地址。
fd所表示的文件句柄,一个文件映射的内容从文件的offset开始,长度length个字节。offset必须是一个内存页大小的倍数(sysconf(_SC_PAGE_SIZE))。
mmap()调用返回后,文件描述器fd在不检查映射的有效性的前提下可以快速关闭。
参数prot描述的是映射的内存保护级别(这个值不能与文件的打开模式冲突)。
prot参数值:
flags参数确定映射的更新对于映射同一区域的其他进程是否可见,以及更新是否传递到基础文件。flags可以有以下值:
MAP_SHARED
共享映射。映射的更新对映射到同一块区域(内存)的其他进程也可见,并且(在文件支持的映射的情况下)被传递到基础文件。
MAP_SHARED_INVALIDATE (Linux 4.15后)
这个值的结果与 MAP_SHARED 一样,只是MAP_SHARED会忽略flags未知的flag值。
MAP_PRIVATE
创建写时复制的私有映射。映射的更新对于映射同一文件的其他进程是不可见的,并且不会传递到基础文件。在mmap()调用后,对文件做出的修改在映射区域是否可见没有明确。
除此外,0或其他的flag值可以使用。
**munmap()**系统调用删除指定地址范围的映射,并导致对该范围内地址的进一步引用生成无效的内存引用。进程终止时,区域也会自动取消映射。另一方面,关闭文件并不能取消内存映射。
返回值
mmap()在成功映射之后会返回映射的指针。一旦出错,返回MAP_FAILED(值是 (void *) -1)值。并且 errno 会被设置以提示这个错误。
munmap()成功执行后返回 0。一旦出错,函数返回 -1,并且 errno 会被设置以提示这个错误(可能是EINVAL)。
在使用mmap进行文件映射时,可以整个文件全部映射到虚拟内存中,也可以部分内容映射。
测试文件大小是101MB。
整个文件一次性映射到进程的虚拟内存。对于超大文件,kernel会自行将文件映射到不同位置。
#include
#include
#include
#include
#include
#include
#include
#include
using namespace std;
void WriteContentWhole(const string &dest_file, const string &msg) {
string input_text = move(msg);
// 要写入的内容长度
int input_text_length = input_text.size();
cout << "预期要写入的文本长度(bytes): " << input_text_length << endl;
// 判断输入的内容最后是否是\n,若不是\n,在输入的文本后添加\n。
if (input_text.at(input_text_length - 1) != '\n') {
char buff[1]{'\n'};
input_text.append(buff);
input_text_length = input_text.size();
}
string path(dest_file);
int fd = open(path.c_str(), O_RDWR | O_APPEND, 777);
if (fd == -1) {
cout << "文件打开失败" << endl;
return;
}
struct stat st;
if (fstat(fd, &st) == -1) {
cout << "file stat error" << endl;
return;
}
off_t new_file_size = 0;
off_t origin_file_size = st.st_size; // 文件大小
// 读取文件最后一个字符,判断是否是\n符号
if (lseek(fd, -1, SEEK_END) == -1) {
perror("无法定位到文件末尾");
return;
}
char buffer[1]{0};
int ret = read(fd, buffer, 1);
if (ret == -1) {
perror("无法读取文件最后一个字符");
return;
}
if ((ret == sizeof(buffer)) && (buffer[0] != '\n')) {
cout << "文件最后一个字符不是'\\n'" << endl;
char buff[1]{'\n'};
input_text.insert(0, buff);
input_text_length = input_text.size();
} else {
cout << "文件最后一个字符是'\\n'" << endl;
}
cout << "最终要写入的文本长度(bytes): " << input_text_length << endl;
// 设置最终写入内容后的新的文件大小
new_file_size = origin_file_size + input_text_length;
int result = ftruncate(fd, new_file_size);
if (result == -1) {
perror("无法设置文件大小");
return;
}
char *mptr = static_cast(
mmap(0, new_file_size, PROT_WRITE | PROT_READ, MAP_SHARED, fd, 0));
// 文件映射完成后,关闭文件
close(fd);
if (mptr == MAP_FAILED) {
cout << "文件内存映射失败," << strerror(errno) << endl;
exit(1);
}
strncpy(mptr + origin_file_size, input_text.c_str(), input_text_length);
munmap(mptr, new_file_size);
}
int main() {
WriteContentWhole("/home/xacsz/dependencies.txt", u8"整个文件进行mmap映射");
cout << "Completed ..." << endl;
return 0;
}
部分映射及将文件的一部分映射到虚拟内存空间中。
#include
#include
#include
#include
#include
#include
#include
#include
using namespace std;
void WriteContent(const string &dest_file, const string &msg) {
string input_text = move(msg);
// 要写入的内容长度
int input_text_length = input_text.size();
cout << "预期要写入的文本长度(bytes): " << input_text_length << endl;
// 判断输入的内容最后是否是\n,若不是\n,在输入的文本后添加\n。
// 这段if判断知识判断输入的内容最后一个是否包含回车换行符。可以忽略
if (input_text.at(input_text_length - 1) != '\n') {
char buff[1]{'\n'};
input_text.append(buff);
input_text_length = input_text.size();
}
string path(dest_file);
int fd = open(path.c_str(), O_RDWR | O_APPEND, 777);
if (fd == -1) {
cout << "文件打开失败" << endl;
return;
}
struct stat st;
if (fstat(fd, &st) == -1) {
cout << "file stat error" << endl;
return;
}
off_t new_file_size = 0;
off_t origin_file_size = st.st_size; // 文件大小
// 读取文件最后一个字符,判断是否是\n符号
if (lseek(fd, -1, SEEK_END) == -1) {
perror("无法定位到文件末尾");
return;
}
char buffer[1]{0};
int ret = read(fd, buffer, 1);
if (ret == -1) {
perror("无法读取文件最后一个字符");
return;
}
if ((ret == sizeof(buffer)) && (buffer[0] != '\n')) {
cout << "文件最后一个字符不是'\\n'" << endl;
char buff[1]{'\n'};
input_text.insert(0, buff);
input_text_length = input_text.size();
} else {
cout << "文件最后一个字符是'\\n'" << endl;
}
cout << "最终要写入的文本长度(bytes): " << input_text_length << endl;
// 设置最终写入内容后的新的文件大小
new_file_size = origin_file_size + input_text_length;
int result = ftruncate(fd, new_file_size);
if (result == -1) {
perror("无法设置文件大小");
return;
}
// 系统页大小
const long kPageSize = sysconf(_SC_PAGE_SIZE);
cout << "内存页大小: " << kPageSize << endl;
// 固定映射内存大小是2M,对文件进行偏移设置,每次将文件指针确认到文件末尾
const size_t mapping_size = kPageSize * 1024 / 2; // 2M映射大小
// 文件偏移
off_t file_offset = 0;
// 将文件索引移动到最后一个映射大小的首位
while (file_offset + mapping_size <= origin_file_size) {
file_offset += mapping_size;
}
size_t remaining_size = origin_file_size - file_offset;
cout << "原始文件大小: " << origin_file_size << ",文件偏移: "
<< file_offset << ",原始文件剩于字节数: " << remaining_size
<< ",映射内存大小: " << mapping_size << ",新文件大小: "
<< new_file_size << endl;
// mmap参数:
// 0 的位置可以传入nullptr,然后由kernel来确定在哪个位置开始开辟虚拟内存空间
// mapping_size 位置传入系统页(sysconf(_SC_PAGE_SIZE))的整数倍,此段代码中2M大小
// PROT_WRITE | PROT_READ 设定了这段内段的访问方式,这里是可读写
// MAP_SHARED 表明这段内存可以被映射相同文件的其他进程可见
// fd 要映射的文件的句柄
// file_offset 文件索引的偏移位置,由于映射到内存(与内存页对应),因此这里传入的值是内存页大小的倍数
char *mptr = static_cast(mmap(0, mapping_size, PROT_WRITE | PROT_READ,
MAP_SHARED, fd, file_offset));
// 文件映射完成后,关闭文件
close(fd);
if (mptr == MAP_FAILED) {
cout << "文件内存映射失败," << strerror(errno) << endl;
exit(1);
}
// 遍历要写入内容的位置。
int start_index_written = origin_file_size - file_offset;
cout << "开始写入的文件偏移位置:" << start_index_written << endl;
strncpy(mptr + start_index_written, input_text.c_str(), input_text_length);
munmap(mptr, mapping_size);
}
int main() {
WriteContent("/home/xacsz/dependencies.txt", u8"世界就是这么庞大!");
cout << "Completed ..." << endl;
return 0;
}
所有不对的地方,欢迎讨论。