iOS-持久化

目的

1.快速展示,提升体验

  • 已经加载过的数据,用户下次查看时,不需要再次从网络(磁盘)加载,直接展示给用户

2.节省用户流量(节省服务器资源)

  • 对于较大的资源数据进行缓存,下次展示无需下载消耗流量
  • 同时降低了服务器的访问次数,节约服务器资源。(图片)

3.离线使用。

  • 用户浏览过的数据无需联网,可以再次查看。
  • 部分功能使用解除对网络的依赖。(百度离线地图、图书阅读器)
  • 无网络时,允许用户进行操作,等到下次联网时同步到服务端。

4.记录用户操作

  • 草稿:对于用户需要花费较大成本进行的操作,对用户的每个步骤进行缓存,用户中断操作后,下次用户操作时直接继续上次的操作。
  • 已读内容标记缓存,帮助用户识别哪些已读。
  • 搜索记录缓存

方法

NSUserDefault 简单数据快速读写
Property list (属性列表)文件存储
Archiver (归档)
SQLite本地数据库
CoreData

数据持久化方式分类

内存缓存

  • 定义

对于使用频率比较高的数据,从网络或者磁盘加载数据到内存以后,使用后并不马上销毁,下次使用时直接从内存加载。

  • 案例

iOS系统图片加载——[UIImage imageNamed:@“imageName”]
网络图片加载三方库:SDWebImage

磁盘缓存

  • 定义

将从网络加载的、用户操作产生的数据写入到磁盘,用户下次查看、继续操作时,直接从磁盘加载使用。

  • 案例

用户输入内容草稿缓存(如:评论、文本编辑)
网络图片加载三方库:SDWebImage
搜索历史缓存

缓存策略(常见缓存算法)

FIFO(First in First Out)

实现原理
FIFO 先进先出的核心思想如果一个数据最先进入缓存中,则应该最早淘汰掉。类似实现一个按照时间先后顺序的队列来管理缓存,将淘汰最早访问的数据缓存。

iOS-持久化_第1张图片
缺点

没有考虑时间最近和访问频率对缓存命中率的影响。对于用户较高概率访问最近访问数据的情况,命中率会比较低。

LFU(Least Frequently Used)

实现原理
LFU 最近最少使用算法是基于“如果一个数据在最近一段时间内使用次数很少,那么在将来一段时间内被使用的可能性也很小”的思路。记录用户对数据的访问次数,将访问次数多的数据降序排列在一个容器中,淘汰访问次数最少的数据。iOS-持久化_第2张图片

缺点
LFU仅维护各项的被访问频率信息,对于某缓存项,如果该项在过去有着极高的访问频率而最近访问频率较低,当缓存空间已满时该项很难被从缓存中替换出来,进而导致命中率下降。

LRU (LeastRecentlyUsed)

实现原理:

LRU 是一种应用广泛的缓存算法。该算法维护一个缓存项队列,队列中的缓存项按每项的最后被访问时间排序。当缓存空间已满时,将处于队尾,即删除最后一次被访问时间距现在最久的项,将新的区段放入队列首部。

iOS-持久化_第3张图片
缺点
LRU算法仅维护了缓存块的访问时间信息,没有考虑被访问频率等因素,当存在热点数据时,LRU的效率很好,但偶发性的、周期性的批量操作会导致LRU命中率急剧下降。例如对于VoD(视频点播)系统,用户已经访问过的数据不会重复访问等场景。

LRU-K (LeastRecentlyUsed)

实现原理:
相比LRU,其核心思想是将“最近使用过1次”的判断标准扩展为“最近使用过K次”。具体来说它多维护一个队列,记录所有缓存数据被访问的历史。仅当数据的访问次数达到K次的时候,才将数据放入缓存。当需要淘汰数据时,LRU-K会淘汰第K次访问时间距当前时间最大的数据。
iOS-持久化_第4张图片
缺点
需要额外的空间来存储访问历史,维护两个队列增加了算法的复杂度,提升了CPU等消耗。

2Q(Two queues)

实现原理:

2Q算法类似于LRU-2,不同点在于2Q将LRU-2算法中的访问历史队列(注意这不是缓存数据的)改为一个FIFO缓存队列,即:2Q算法有两个缓存队列,一个是FIFO队列,一个是LRU队列。

iOS-持久化_第5张图片
缺点
需要两个队列,但两个队列本身都比较简单,2Q算法和LRU-2算法命中率、内存消耗都比较接近,但对于最后缓存的数据来说,2Q会减少一次从原始存储读取数据或者计算数据的操作。

MQ(Multi Queue)

实现原理:

MQ算法根据优先级(访问频率)将数据划分为多个LRU队列,其核心思想是:优先缓存访问次数多的数据。

iOS-持久化_第6张图片
缺点
多个队列需要额外的空间来存储缓存,维护多个队列增加了算法的复杂度,提升了CPU等消耗。

iOS端可供选择的数据持久化方案

内存缓存

实现内存缓存的技术手段包括苹果官方提供的NSURLCache,NSCache,还有性能和API上比较有优势的开源缓存库YYCache、PINCache等。

磁盘缓存

  • NSUserDefault

适合小规模数据,弱业务相关数据的缓存。

  • keychain

Keychain是苹果提供的带有可逆加密的存储机制,普遍用在各种存用户名、密码的需求上。另外,Keychain是系统级存储,还可以被iCloud同步,即使App被删除,Keychain数据依然保留,用户下次安装App,可以直接读取,通常会用来存储用户唯一标识串。所以需要加密、同步iCloud的敏感小数据,一般使用Keychain存取。

  • 文件存储
    • Plist:一般结构化的数据可以Plist的方式去持久化
    • archive:Archive方式可以存取遵循协议的数据,比较方便的是存取使用的都是对象,不过中间的序列化和反序列化需要花费一定的性能,可以在想要使用对象直接进行磁盘存取时使用。
    • Stream:指文件存储,一般用来存图片、视频文件等数据
  • 数据库存储

数据库适合存取一些关系型的数据;可以在有大量的条件查询排序类需求时使用。

    • Core Data:苹果官方封装的ORM(Object Relational Mapping)
    • FMDB:github最受欢迎的iOS sqlite 封装开源库之一
    • WCDB:微信团队在自己使用的sqlite封装基础上的开源实现,具有ORM(Object Relational Mapping)的特性,支持iOS、Android。
    • Realm:由Y Combinator孵化的创业团队开源出来的一款跨平台(iOS、Android)移动数据库。

应该用哪种缓存方案

根据需求选择:

  • 简单数据存储直接写文件、key-value存取即可。
  • 需要按照一些条件查找、排序等需求的,可以使用sqlite等关系型存储方式。
  • 敏感性高的数据,加密存储。
  • 不希望App删除后清除的小容量数据(用户名、密码、token)存keychain。

内存、磁盘数据持久化方案对比

可选方案详解

特性

  • 属性
    • 名称
    • delegate:obj从cache移除时,通知代理
    • countLimit:存储数限制
    • costLimit:存储空间开销值限制(不精确)
    • evictsObjectsWithDiscardedContent(自动回收废弃内容,没看到这个属性的使用场景)
  • 方法
    • 使用key同步存、取、删
    • 删除所有内容

实现

NSCacheEntry:内部类,将key-value转换成改实体,用来实现双向链表存储结构

    • key:键
    • value:值
    • cost:开销
    • prevByCost:上个节点
    • nextByCost:下个节点

NSCacheKey:对存取使用的key的封装,用于实现存取使用不支持NSCopy协议的object

  • value:存取使用的key的值

_entries:NSDictionary,使用它以键值对形式存取NSCacheEntry实例
_head:双向链表头节点,链表按cost升序排序;setObject触发costLimit/countLimit trim时,从根节点开始删除
NSLock:实现读写线程安全

TMCache

TMCache 最初由 Tumblr 开发,但现在已经不再维护了。TMMemoryCache 实现了很多 NSCache 并没有提供的功能,比如数量限制、总容量限制、存活时间限制、内存警告或应用退到后台时清空缓存等。TMMemoryCache 在设计时,主要目标是线程安全,它把所有读写操作都放到了同一个 concurrent queue 中,然后用 dispatch_barrier_async 来保证任务能顺序执行。它错误的用了大量异步 block 回调来实现存取功能,以至于产生了很大的性能和死锁问题。
由于该库很久不再维护,不做详细对比。

PINCache

Tumblr 宣布不在维护 TMCache 后,由 Pinterest 维护和改进的一个缓存SDK。它的功能和接口基本和 TMCache 一样,但修复了性能和死锁的问题。它同样也用 dispatch_semaphore 来保证线程安全,但去掉了dispatch_barrier_async,避免了线程切换带来的巨大开销,也避免了可能的死锁。

特性:

PINCaching(protocal)
属性

  • 名称

方法

  • 同步/异步使用key存、取、删、判断存在、设置ttl时长、存储空间消耗值
  • 同步/异步删除指定日期之前的数据(磁盘缓存指创建日期)
  • 同步/异步删除过期数据
  • 同步/异步删除所有数据

PINMemoryCache
属性

  • totalCost:已经使用的总开销
  • costLimit:开销(内存)使用限制(每次赋值时,触发trim)
  • ageLimit:统一生命周期限制(每次赋值时,触发trim;GCD timer循环触发)
  • ttlCache:是否ttl,配置此项,获取数据只会返回生命周期存活状态的数据
  • removeAllObjectsOnMemoryWarning
  • removeAllObjectsOnEnteringBackground
  • 将要/已经添加、移除缓存对象block监听
  • 将要/已经移除缓存所有对象block监听
  • 已经接收内存警告、已经进入后台block监听

方法

  • 同步/异步删除数据到指定的cost以下
  • 同步/异步删除在指定日期之前的数据,继续删除数据到指定的cost以下(trimToCostLimitByDate)
  • 同步/异步遍历所有缓存数据

内部实现

  • 通过NSMutableDictionary保存需要缓存的数据,通过额外的NSMutableDictionary来保存createdDates(创建时间)、accessDates(最近访问时间)、costLimit、ageLimit等信息
  • 使用互斥锁保证多线程安全
  • 使用PINOperationQueue实现异步操作
  • setObject触发costLimit trim时,对accessDates进行排序,实现LRU策略

PINDiskCache

  • prefix:缓存名前缀
  • cacheURL:缓存路径url
  • byteCount:硬盘已存储数据大小
  • byteLimit:最大硬盘存储空间限制,默认50M(每次赋值时,触发trim)使用时注意,丢数据时不清楚为什么
  • ageLimit:同PINMemoryCache;默认30天
  • writingProtectionOption:
  • ttlCache:同PINMemoryCache
  • removeAllObjectsOnMemoryWarning(同PINMemoryCache)
  • removeAllObjectsOnEnteringBackground(同PINMemoryCache)
  • 将要/已经添加、移除缓存对象block监听(同PINMemoryCache)
  • 将要/已经移除缓存所有对象block监听(同PINMemoryCache)
  • 已经接收内存警告、已经进入后台block监听(同PINMemoryCache)
  • 支持对key进行自定义编码和解码(默认移除特殊字符 . : / %)
  • 支持对数据进行自定义序列化和反序列化(默认NSKeyedArchiver,需要遵守NSCoding协议)

方法

  • lockFileAccessWhileExecutingBlockAsync、synchronouslyLockFileAccessWhileExecutingBlock:执行完所有文件写操作后回调block
  • fileURLForKey:获取指定文件的fileUrl
    同步/异步删除数据到指定的cost以下(同PINMemoryCache)
  • 同步/异步删除在指定日期之前的数据,继续删除数据到costLimit以下(同PINMemoryCache)
  • 同步/异步遍历所有缓存数据(同PINMemoryCache)

内部实现

  • 通过PINDiskCacheMetadata保存数据信息:createdDate、lastModifiedDate、size、ageLimit;初始化时,加载所有文件的metadata,保存在一个NSMutableDictionary中,通过fileKey存取;
  • 读取文件获取createdDate、lastModifiedDate、size等信息回写metadata;setxattr、removexattr、getxattr存储ageLimit信息,回写metadata
  • trimDiskToSize:按照文件大小降序排序删除,先删大文件
  • trimDiskToSizeByDate:按最近修改时间升序排序,先删较长时间未访问的(LRU)
  • trimToDate:删除创建日期在指定日期之前的文件(按修改时间倒序)
  • 使用互斥锁保证多线程安全:
  • 使用PINOperationQueue实现异步操作
  • 对accessDates进行排序,实现LRU策略

PINCache
属性

  • diskByteCount:设置diskCache,byteCount
  • diskCache:磁盘缓存
  • memoryCache:内存缓存

方法

  • 仅有初始化方法及 的实现

实现

  • 二级缓存实现:先取内存;后取磁盘,取磁盘同时更新内存
  • 使用同一个PINOperationQueue实现异步操作
  • PINOperationGroup来实现内存缓存和磁盘缓存结束回调

实现

PINOperationQueue(async任务通过自定义的PINOperationQueue实现)

  • pthread_mutex PTHREAD_MUTEX_RECURSIVE(添加operation,线程安全)
  • dispatch_queue:
    DISPATCH_QUEUE_SERIAL:并发数1时,直接使用串行队列执行;使用串行队列保证对信号量数据操作是安全的(修改并发数时,修改信号量数量)
    DISPATCH_QUEUE_CONCURRENT:执行block中的耗时操作
  • dispatch_group:阻塞当前线程,用来实现 waitUntilAllOperationsAreFinished
  • dispatch_semaphore:并发数量控制,并发数为大于1时使用。

PINOperationGroup

  • dispatch_group_enter、dispatch_group_leave、dispatch_group_notify,来回调group结束block

LRU淘汰

  • 每次设置新的object时,超出costLimit部分,根据访问时间倒序删除

线程安全

  • pthread_mutex_lock 互斥
    PINOperationQueue 实现多线程队列任务

YYCache

大神郭曜源开源的一个内存缓存实现,YYCache是对标PINCache实现的,实现了PINCache大部分的能力,同时做了一些针对性性能优化。
内存缓存相对于 PINMemoryCache 来说,去掉了异步访问的接口,尽量优化了同步访问的性能,用 OSSpinLock pthread_mutex_t互斥锁来保证线程安全。另外,缓存内部用双向链表和 NSDictionary 实现了 LRU 淘汰算法。
磁盘缓存支持设置文件尺寸阈值来控制写磁盘还是存数据库。

特性

YYMemoryCache

  • 属性
    • name:名称
    • totalCount:缓存数
    • totalCost:已经使用的总开销
    • countLimit:缓存数限制(并非严格限制,GCD timer定时触发后台线程trim)
    • costLimit:开销(内存)使用限制(并非严格限制,GCD timer定时触发后台线程trim)
    • ageLimit:统一生命周期限制(并非严格限制,GCD timer定时触发后台线程trim)
    • autoTrimInterval:定时触发trim时长,默认5s
      shouldRemoveAllObjectsOnMemoryWarning
    • shouldRemoveAllObjectsWhenEnteringBackground
    • releaseOnMainThread:是否允许主线程销毁内存键值对,默认NO;注意,指定该值为YES后,YYMemoryCache的缓存只有回到主线程才把缓存的对象销毁,即执行release操作。
    • releaseAsynchronously:是否异步线程销毁内存键值对,默认YES
    • 已经接收内存警告、已经进入后台block监听
  • 方法
    • 同步使用key存、取、删、判断存在、设置每个存储内存开销值
    • 同步/异步删除所有缓存(根据releaseOnMainThread、releaseAsynchronously决定)
    • 同步trim删除数据到指定的count以下
    • 同步trim删除数据到指定的cost以下(从tail开始移除,即移除最近未访问数据)
    • 同步trim删除在指定日期之前的数据
  • 内部实现
    • _YYLinkedMapNode:链表节点,key、value、pre、next、cost、time(CACurrentMediaTime,最近访问时间)信息保存
    • _YYLinkedMap:最终使用_YYLinkedMap的节点通过链表方式执行增、删、改操作
    • dic、totalCost、totalCount、head(MRU)、tail(LRU)、releaseOnMainThread、releaseAsynchronously
    • insertNodeAtHead
    • bringNodeToHead
    • removeNode
    • removeTailNode
    • removeAll
    • 链表最新访问的放在头结点,便于执行trim操作,直接从尾节点开始删除
    • 使用pthread_mutex_t互斥锁保证线程安全
    • 使用DISPATCH_QUEUE_SERIAL执行增加obj缓存触发costLimit情况下的trim任务

YYDiskCache

  • 属性
    • name:缓存名
    • path:缓存路径
    • inlineThreshold:控制保存sqlite或文件的阈值,大于该值存文件,默认20KB
    • customArchiveBlock、customUnarchiveBlock:对数据进行自定义序列化和反序列化(默认NSKeyedArchiver,需要遵守NSCoding协议)
      customFileNameBlock:根据key名称对文件名做自定义
    • countLimit:同YYMemoryCache;默认无限制
    • costLimit:同YYMemoryCache,这里指真实的磁盘存储大小;默认无限制
    • ageLimit:同YYMemoryCache;默认无限制
      freeDiskSpaceLimit:磁盘可缓存最小剩余空间限制;默认0
    • autoTrimInterval:同YYMemoryCache,默认60s
    • errorLogsEnabled:错误日志
  • 方法
    • 同步/异步使用key存、取、判存、删数据
    • 同步/异步删除所有数据
    • 异步删除所有数据并在block回调进度
    • 同步/异步获取totalCount、totalCost
    • 同步/异步trimToCount、trimToCost、trimToAge
    • 为指定object绑定extendedData
  • 内部实现
    • 使用dispatch_semaphore_t:信号量设置为1,作为锁使用了
    • 使用dispatch_queue_t:DISPATCH_QUEUE_CONCURRENT,异步线程执行trim、CRUD等
    • 注意:这导致所有的异步操作回调block都是在异步线程,没在主线程
    • _globalInstances:NSMapTable缓存了所有初始化的diskCache实例,key strong,value weak
      YYKVStorage
  • 属性
    • path:缓存路径
    • type:YYKVStorageTypeFile、YYKVStorageTypeSQLite、YYKVStorageTypeMixed
    • errorLogsEnabled
    • 方法
    • 保存key-value数据
    • 根据key删除key-value数据;删除超过指定size的数据(访问时间倒序删除,每次删除16个);删除指定时间之前的数据(同);删除数据到整体储存空间到指定size内;删除数据到整体储存数量到指定count内;删除所有数据
    • 使用key取数据
    • 判断指定key是否存在数据;获取存储数量;获取存储占用size
  • 实现
    • 内部使用selite存取数据
    • 删除所有数据:先移动到指定的trash目录下,然后后台删除trash目录?移动文件比删除文件更快?
    • DISPATCH_QUEUE_SERIAL:后台删除trash

YYCache

  • 属性
    • name:名称
    • memoryCache:内存缓存
    • diskCache:磁盘缓存
  • 方法
    • 同步/异步使用key存、取、判存、删除数据
    • 同步/异步删除所有数据
    • 异步删除所有数据并在block回调进度
  • 实现
    • 二级缓存:先取内存,再取磁盘
    • 异步操作直接使用globalQueue执行了。

实现

  • 磁盘存取:封装YYKVStorage执行文件读写、seqlite操作,具体的存取操作交给它完成
  • 内存LRU淘汰:每次设置新的object时,超出costLimit部分,根据访问时间倒序删除(借助链表)
    线程安全
  • pthread_mutex_lock 互斥 实现内存缓存线程安全
  • dispatch_semaphore_t:信号量设置为1,作为锁使用了

内存缓存方案对比

性能

YYCache的读写性能均较为优秀。NSCache和PINCache各有优劣。iOS-持久化_第7张图片
iOS-持久化_第8张图片
iOS-持久化_第9张图片iOS-持久化_第10张图片
iOS-持久化_第11张图片

plist文件

plist全名Property List,属性列表文件,它是一种用来存储串行化后的对象的文件,属性列表文件的扩展名为.plist ,因此通常被称为plist文件。文件是xml格式的。plist文件通常用于储存用户设置,也可以用于存储捆绑的信息。

平时的info.plist就是一个plist文件

#import <Foundation/Foundation.h>

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        // 创建一个NSMutableDictionary对象
        NSMutableDictionary *plistData = [[NSMutableDictionary alloc] init];
        
        // 添加一些示例数据到plistData字典中
        [plistData setObject:@"John Doe" forKey:@"Name"];
        [plistData setObject:@"[email protected]" forKey:@"Email"];
        [plistData setObject:@30 forKey:@"Age"];
        
        // 获取文件路径,可以根据需要修改保存路径
        NSArray *paths = NSSearchPathForDirectoriesInDomains(NSDocumentDirectory, NSUserDomainMask, YES);
        NSString *documentsDirectory = [paths objectAtIndex:0];
        NSString *plistPath = [documentsDirectory stringByAppendingPathComponent:@"data.plist"];
        
        // 写入plist文件
        [plistData writeToFile:plistPath atomically:YES];
        
        NSLog(@"Plist文件已创建并写入成功:%@", plistPath);
    }
    return 0;
}

iOS-持久化_第12张图片
这样的j话我们就能通过打印的文件目录来查看写入的东西了iOS-持久化_第13张图片

你可能感兴趣的:(ios,objective-c)