MMKV( 一) 了解原理

前言:由于知识点多,分了多个记录。

MMKV( 一) 了解原理
MMKV (二)基础知识点和实现流程解析
MMKV (三) POSIX线程和文件锁

导言:MMKV 可以多进程通信,实际上就是共享文件的方式,是基于 mmap 内存映射的 key-value 组件,底层序列化/反序列化使用 protobuf 实现,性能高,稳定性强,可以跨进程

和SharePreference 对比

sharepreference获取.png

SharePreference 源码实现 SharePreferenceImpl.java 对xml的读写


sharepreference读取.png

不能跨进程,如果非要跨进程配合ContentProvider使用。

读写方式:I/O
数据格式:XML
k-v 更新:全量更新,n个k-v->序列化成xml io->文件

MMKV 对比

I/O vs mmap
数据格式:
1、总体结构
2、整型编码
3、计算长度
增量与全量写入

mmap 和 mmap的优缺点

Linux通过将一个虚拟内存区域与一个磁盘上的对象关联起来,以初始化这个虚拟内存区域的内容,这个过程称为内存映射(memory mapping)。

mmap模型.png

对文件进行mmap,会在进程的虚拟内存分配地址空间,创建映射关系

实现这样的映射关系后,就可以采用指针的方式读写操作这一段内存,而系统会自动回写到对应的文件磁盘上

I/O 在系统的操作流程

虚拟内存被操作系统划分成两块:用户空间和内核空间,用户空间是用户程序代码运行的地方,内核空间是内核代码运行的地方。为了安全,它们是隔离的,即使用户的程序崩溃了,内核也不受影响。

IO读写模型.png

写文件流程:

1、调用write,告诉内核需要写入数据的开始地址与长度
2、内核将数据拷贝到内核缓存
3、由操作系统调用,将数据拷贝到磁盘,完成写入

优点
  • MMAP对文件的读写操作只需要从磁盘到用户主存的一次数据拷贝过程,减少了数据的拷贝次数,提高了文件读写效率。
  • MMAP使用逻辑内存对磁盘文件进行映射,操作内存就相当于操作文件,不需要开启线程,操作MMAP的速度和操作内存的速度一样快;
  • MMAP提供一段可供随时写入的内存块,App 只管往里面写数据,由操作系统如内存不足、进程退出等时候负责将内存回写到文件,不必担心 crash 导致数据丢失。

参考微信和美团
微信 Mars : https://mp.weixin.qq.com/s/kDPTt9Rtd-PERXXW-UyUlQ

美团 Logan : https://tech.meituan.com/2018/02/11/logan.html

防止数据丢失并提升了读写效率。

写入内存 写入mmap 写入文件
OS X 17ms 18ms 2685ms
iOS 55ms 55ms 13116ms
Android 283ms 2488ms 7583ms

三大优势

mmap防止数据丢失,提高读写效率;

精简数据,以最少的数据量表示最多的信息,减少数据大小;

增量更新,避免每次进行相对增量来说大数据量的全量写入

缺点

因为我们是按照页存储方式,每页4096字节,我们只有100字节使用,那么整个页4096字节映射,所以造成一定的浪费

MMKV 存储的数据结构

mmkv数据结构.png

对比xml 结构

xml样例.png

整型编码

1个字节保存7位数据
如果写入的数据 <= 0x7f 那么使用7位即1个字节表示。
如果写入的数据 > 0x7f 那么先记录低7位数据,并将最高位设为1,继续执行判断

整型编码.png

写入方式

增量写入:
不管key是否重复,直接将数据追加在前数据后。

如果不断 增量 追加内容,文件越来越大,怎么办?

全量写入:
当文件大小不够,这时候需要全量写入。将数据去掉重复key后,如果文件大小满足写入的数据大小,则可以直接更新全量写入,否则需要扩容。(在扩容时根据平均每个K-V大小计算未来可能需要的文件大小进行扩容,防止经常性的全量写入)

扩容

扩容非常简单,只需要重新设定文件大小,然后重新mmap映射即可

//重新设定文件大小
ftruncate(m_fd, m_size);
//解除映射
munmap(m_ptr, oldSize);
//重新映射
m_ptr = (int8_t *) mmap(m_ptr, m_size, PROT_READ | PROT_WRITE, MAP_SHARED, m_fd, 0);

存储的小例子

010 编辑器查看截图,总长度-》key长度-》value长度

没有xml 的冗余数据,更小,更方便增量更新。总长度改下,k-v 在后面追加就可以了。内存中的map集合中永远是最新的数据。

Protobuf 变长编码 例子

编码65280-》

1111 1111 0000 0000

取低七位:000 0000,最高位补1(表示还需要下一个字节)

1000 0000 -》写出

右移7位:1111 1111 0

取低七位:111 1110,最高位补1

1111 1110 -》 写出
右移7位:11

小于0x7f,最高位不需要设置为1

0000 0011 -》写出

解析:

1000 0000
1111 1110
0000 0011

拿后7位,7个0
000 0000高位是1需要继续获取
再次拿后7位
111 1110 高位是1需要继续获取拼接 111 1110 000 0000
再次拿后7位
000 0011 高位0,不许继续,直接拼接去掉头部无用0
000 0011111 1110 000 0000

最后整理之后
1111 1111 0000 0000

被编译成了3个字节,定长编码应该是4个字节,节省1个字节


1页4096 字节,linux 按照页方式存储,超过1页数据量发生页中断。

参考MMKV 文档

官方项目MMKV project

下一篇文章 MMKV(二) 基础知识和核心流程

你可能感兴趣的:(MMKV( 一) 了解原理)