这是一个将pdf转化为html的服务,开源的。
此功能服务的代码在git上的地址为:
https://github.com/coolwanglu/pdf2htmlEX/wiki
安装:
在ubuntu上安装:
输入命令
sudo apt install pdf2htmlex
即可安装完成
在mac上面安装:
sudo brew install pdf2htmlex
即可
配置:
如果在将一个pdf转为多个html的话,用于项目中可能会出现在入口的那个html文件中找不到其他的html
在命令行中输入:
pdf2htmlEX -v
会出现配置文件的位置,如下图所示
使用open把上面的那个路径打开,在我这里就是
open /usr/local/Cellar/pdf2htmlex/0.14.6_16/share/pdf2htmlEX
就打开了这个配置文件夹
找到manifest文件,打开找到@pdf2htmlEX..min.js
方便起见,将其改为 @pdf2htmlEX.js
然后打开上面的那个js文件
搜索:data-page-url
将:
var url = cur_page_ele.getAttribute('data-page-url');
改为:
var url = location.href.substring(0,location.href.lastIndexOf('/'))+'/'+cur_page_ele.getAttribute('data-page-url');
(这是将所去的各个页面的路径设为当前目录下,再拼上自己的路径),这样即可。
使用:
在项目中使用的时候,可以把刚刚上面的那个文件夹复制到resources下面,在使用php执行命令(exec函数及system函数等)的时候可以在命令中指定配置文件 --data-dir 配置文件目录路径 ,这样在将pdf转化为html的时候就可以使用你所指定的配置生成html了。
在项目中,一般情况下将html和css及js分开,然后将共同的css及js这类静态文件放在public文件夹中一份,在加载文件的时候,直接加载public文件夹中的那个静态资源即可。
将@引入的css及js都注释或者删掉,在引入外部文件的区域使用或