2.了解epub文件格式结构

文件组成

一个未经加密处理的epub电子书由以下三部分组成:

META-INF(文件夹,里面有一个container.xml文件)
OEBPS (文件夹,包含images文件夹、很多xhtml文件、css文件和content.opf文件)
mimetype

文件mimetype

每个epub电子书均包含一个mimetype的文件,且内容不变,用以说明epub的文件格式。

application/epub+zip

文件夹META-INF

META-INF用于存放容器信息,默认情况下此目录只包含一个文件container.xml,文件内容如下:



    
        
    

container.xml文件的主要功能用于告诉阅读器,电子书的根文件的路径和打开格式

文件夹OEBPS

OEBPS目录用于存放OPF文档、CSS文档、NCX文档

文件OPF

OPF文档是epub的核心文件,且是一个标准的xml文件,依据OPF规范,此文件的根元素为


其内容主要由五部分组成:


  1. 元数据信息,这个标签里面是书籍的出版信息,由两个子元素组成
  • 标题
  • 责任人
  • 主题词、关键词
  • 内容描述
  • 日期
  • 类型
  • 出版者
  • 发行者
  • 格式
  • 标识信息
  • 来源信息
  • 语言
  • 相关资料
  • 覆盖范围
  • 权限描述

  1. 文件列表,列出书籍出版的所有文件,但是不包括 mimetype、container.xml、content.opf,由一个个子元素构成
   
  • id 文件的id号
  • href 文件的相对路径
  • media-type 文件的媒体类型

 
 
 
 
 
 

提供书籍的线性阅读次序,由一个个子元素构成

 
  • idref 即参考manifest列出的id

  1. 指南,一次列出电子书的特定页面
  
   
   
  

  1. 导读,可以根据读者水平或阅读目的,按一定的次序,选择电子书的部分页面组成导读

NCX文件

NCX文件是epub电子书的另一个重要文件,用于制作电子书的目录。.ncx文件中最主要的节点是navMap,navMap节点是由许多navPoint节点组成



    
        
        
        
        
    
    
        1984
    
    
        [英] 乔治·奥威尔
    
    
        
            
                目录
            
            
        
        
            
                前言
            
            
        
        
            
                  第一部
            
            
        
        
            
                  第1节
            
            
        
        
            
                  第2节
            
            
        
        
            
                  第3节
            
            
        
    

文章出处:https://www.jianshu.com/p/d930dc5599aa

你可能感兴趣的:(2.了解epub文件格式结构)