pdf2htmlex的下载及使用

这是一个将pdf转化为html的服务,开源的。

此功能服务的代码在git上的地址为:

https://github.com/coolwanglu/pdf2htmlEX/wiki

 安装:

在ubuntu上安装:

输入命令

sudo apt install pdf2htmlex

即可安装完成

 

在mac上面安装:

sudo brew install pdf2htmlex 

即可

 

配置:
如果在将一个pdf转为多个html的话,用于项目中可能会出现在入口的那个html文件中找不到其他的html

在命令行中输入:

pdf2htmlEX -v

会出现配置文件的位置,如下图所示

pdf2htmlex的下载及使用_第1张图片

使用open把上面的那个路径打开,在我这里就是

open /usr/local/Cellar/pdf2htmlex/0.14.6_16/share/pdf2htmlEX

 就打开了这个配置文件夹

找到manifest文件,打开找到@pdf2htmlEX..min.js

方便起见,将其改为 @pdf2htmlEX.js

然后打开上面的那个js文件

搜索:data-page-url

将:

var url = cur_page_ele.getAttribute('data-page-url');

改为: 

var url = location.href.substring(0,location.href.lastIndexOf('/'))+'/'+cur_page_ele.getAttribute('data-page-url');

(这是将所去的各个页面的路径设为当前目录下,再拼上自己的路径),这样即可。

 

使用:

在项目中使用的时候,可以把刚刚上面的那个文件夹复制到resources下面,在使用php执行命令(exec函数及system函数等)的时候可以在命令中指定配置文件  --data-dir  配置文件目录路径 ,这样在将pdf转化为html的时候就可以使用你所指定的配置生成html了。

在项目中,一般情况下将html和css及js分开,然后将共同的css及js这类静态文件放在public文件夹中一份,在加载文件的时候,直接加载public文件夹中的那个静态资源即可。

将@引入的css及js都注释或者删掉,在引入外部文件的区域使用

你可能感兴趣的:(python,python)