开发node桌面级应用工具:apk转化epub

随着苹果ibooks对国内的开放,最近接了个麻烦的需求:

把现有的APK转化支持苹果ibooks电子书的epub格式

  • apk,基本都知道就是安卓的应用程序
  • epub,是ibooks支持的电子书格式 (xhtml组成的静态多页面)

这apk与epub两个完全不是一个世界的东西,怎么能关联并转化?

因为我司产出的APK应用是通过phonegap打包的SPA应用,这也是一套黑科技,通过ppt批量生成应用,本质上还是web那一套,所以给epub转化提供契机

通过H5写应用已经流行几年了,这里也不多说了,如流行的phonegap国产appcan、APICloud和HBuilder之类的打包工具太多了,本质上基本差不都,如果没有接触的可以看看

这是一个APK

image

APK解压后的文件结构

开发node桌面级应用工具:apk转化epub_第1张图片

其中assets就是web目录,其中还包含应用的sqlite数据库

开发node桌面级应用工具:apk转化epub_第2张图片

很明显只有一个index的单面结构,现用就是需要把index单页面,分解成多个独立的静态页面,并且要符合xhtml语法规范

常规来说,这只是一个静态分析,应该简单。

但是这里我没有采用静态分析,原因不多说,跟项目的复杂度有关系,详情可以参考我的项目分享 Hybrid App应用制作与跨平台解决方案

 

我采用的是动态编译,简单来说,让浏览器自己解析

通过加载一个后台的Chromium来解析页面,然后直接提取出Chromium渲染后的最终HTML结构

如果只是这样解析,提取的只可能当前执行的页面部分,不可能是全部的页面结构

因此,依照静态编译的思路需要符合几点要求

  1. 单页面的入口index.html,能够根据传递参数自动加载不同的页面
  2. 数据库xxtebook.db能够通过算法分解到每一个独立的页面中,做成json的数据格式

考虑到最终是桌面级应用工具,我这里采用了node语言编写

当然用node的原因也是因为有神器node-webkit,可以把node打包成exe执行文件

 

具体的思路流程:

读取apk文件 =》改名rar =》解压后读取web目录

=》读出sqlite数据

=》根据数据创建基本页面 n*.xhtml多个

=》给生成的所有xhtml页面写入区分页面标记(因为apk中的web资源代码是共享的js/css/图片等等)

=》将所有ajax处理的资源转化成js格式(如 svg 读出数据写入js文件,静态访问直接加载这个脚本)

=》分解每个页面的数据sqlite数据,并写入到对应的xhtml中(数据库的数据需要分解成json写入对应的页面中)

=》启动web服务器

=》启动webkit,并加载每一个xhtml页面做分解,等待页面渲染拿到每个页面最终的静态结构

=》合并epub的标准文件结构,生成对应的规范

=》打包输出最终的epub文件

 

对比下单页面结构与多个xhtml静态文件

 

单页面SPA结构,通过JS生成DOM

通过JS动态渲染HTML结构,页面总入口都是同一个

开发node桌面级应用工具:apk转化epub_第3张图片开发node桌面级应用工具:apk转化epub_第4张图片

 

静态xhtml,DOM与数据静态化

开发node桌面级应用工具:apk转化epub_第5张图片开发node桌面级应用工具:apk转化epub_第6张图片

 

把一个index分解成多个xhtml页面,每个页面的js、css等资源代码都是共享的,所以需要在每一个页面写入不同的数据,用来区分页面

架设一个web服务端,通过http加载这些xhtml页面,通过浏览器解析就能得到最终独立xhtml的结构

由于执行代码做了接口处理,只要xhtml中传递不同的页码,代码就自动执行不同的页面,这样就能达到,不同的页面都有不同的解析结果

由于是node全自动操作,所以web与页面的解析都必须通过自动化工具处理,这里我用的是browser-sync与phantomjs

通过phantomjs 解析后就能拿到浏览器渲染后的HTML结构了

 

遇到的问题:

解压丢失文件:node确实没有一个解压插件好使,最终用shell执行脚本命令,通过调用winrar软件处理

node-webkit不支持64位的sqlite3读取:这是因为nodejs和node-webkit的ABI不同,处理的办法就是重新编译64位的sqlite3,我估计很难成功,后来找了一款神器 sql.js直接数据库分解

phantomjs可以通过execFile调用,但是执行路径,是以node调用命名为根路径计算的

phantomjs加载页面,需要监听onResourceReceived事件,之后再获取数据,页面的完全渲染无法把控的,有请求,有JS绘制等等,必须有一个延时的等待

通过browser-sync做服务器,phantomjs获取的html的结构中会有__bs_script__这个注入节点,需要删除

通过browser-sync做服务器,background加载的url都会加上整个http跟地址,所以在最终数据中需要处理

 

打包运行的效果

开发node桌面级应用工具:apk转化epub_第7张图片

UI有点丑。。。

如果有这方面需求,或者有啥疑问的,可以留言。。。。

你可能感兴趣的:(开发node桌面级应用工具:apk转化epub)