用linux文件系统的链接功能实现文件缓存LRU

概述:

       目前,随着家庭宽带网络、无线宽带技术,以及终端设备性能的不断发展,基于多媒体的应用越来越广泛,特别是互联网视频的应用更是成为推动这些技术发展的源动力。作为互联网视频VOD的应用,提高视频播放的流畅度是一个非常重要的指标之一。除了编解码技术,视频CDN技术是解决用户视频播放流畅度的首要环节,而CDN技术中除了智能调度技术,边缘服务器的性能优化也是非常重要的环节之一。本方法就是着眼于边缘服务器的性能优化,以有限的边缘服务器磁盘存储空间为前提,利用LRU方法实现对视频Cache对象的动态管理,从而充分利用有限的磁盘空间,提升用户服务体验,满足未来长期运营的需要。

实现方法:

       本方法所要解决的技术问题是对于以文件为缓存对象的缓存服务器,如何来实现一个LRU的缓存管理算法。本人用本文描述的方法基于nginx,实现了CDN大容量缓存服务功能。

      有人会问,nginx本身不是提供了cache功能吗?是的,nginx本身确实有cache能力,但是它有它的问题,比如:文件的索引都是在内存中的,启动的时候需要通过遍历目录树的方式将文件的索引加载到内存,对内存的要求就比较高,启动初始化的过程比较长。本方法正好克服了这个缺点,服务器的内存使用不会随着缓存内容的增加而增加。

      本方法所实现的技术方案是,利用Linux系统(或者类Unix系统)所提供的文件链接的功能,对被缓存的文件对象采用硬链接来记录文件的被访问时间,用软链接来指向最近被访问的Cache对象的硬链接版本,并通过按时间顺序批量淘汰的方式来实现LRU的功能。

以下对本方法的具体实现方式进行说明。

首先,先说明一下Cache对象在磁盘上的存储方式。

  1. Cache对象是以文件的方式存储到磁盘上的。每个Cache对象会对应一个URL,这个URL是用户访问的路径,将URL的相对路径部分(除了http://domain部分)进行HASH,映射成磁盘中的存储路径。譬如,对于URL为 http://vod.test.com/movie/file/path/name.ts的Cache对象,我们用/movie/file/path/name.ts部分进行MD5 hash,计算得到MD5值是8f595e5b69f

你可能感兴趣的:(高性能,linux,缓存,运维,nginx,cache,cdn)