1.1ppthtml

1.1.1pptpdf

通过libreoffice工具转换成pdf

这个在windows实现 下载好就行   跟平常的软件一个用法

 图片没上传上去抱歉、、



打开


保存到你要保存的目录

1.1.2pdfhtml

参见github

https://github.com/coolwanglu/pdf2htmlEX/wiki/Download


Docker容器运行是将pdf文件转换为html的最简单的方法,您不需要知道如何编译和安装pdf2htmlEX

     因为pdf2htmlEX 安装太麻烦了依赖太多

1.1.2.1  安装docker

系统centos6.8

yum install -y docker-io
/etc/init.d/docker start

1.1.2.2  如何使用这个docker容器把pdf文件转换成html

假设你有一个PDF文件/ pdf / test.pdf,只需运行

docker run -ti --rm -v ~/pdf:/pdf bwits/pdf2htmlexpdf2htmlEX --zoom 1.3 test.pdf

test.html~/pdf目录中生成一个HTML文件。

首次执行会从仓库拉一个镜像下来等待时间较长

[root@lanyezi ~]# docker p_w_picpaths
REPOSITORY         TAG                 IMAGE ID            CREATED             VIRTUAL SIZE
bwits/pdf2htmlex   latest             bacf7f15f6e6        23 monthsago       245.6 MB

1.1.2.3  运行docker容器作为本地命令

设置一个软连接。。docker运行容器然后执行对应的命令

alias pdf2htmlEX='docker run -ti --rm -v `pwd`:/pdfbwits/pdf2htmlex pdf2htmlEX'
pdf2htmlEX -h
pdf2htmlEX --zoom 1.3 test.pdf

有关如何安装docker的详细信息,请参阅https://docs.docker.com/installation/ 

有关如何运行pdf2htmlEX的详细信息,请阅读维基

https://github.com/coolwanglu/pdf2htmlEX/wiki/Quick-Start


1.1.3关于如何运行pdf2htmlEX

1.1.3.1  第一件事先

强烈建议您安装ttfautohint并随时添加--external-hint-tool=ttfautohint以下每个配方。此工具可以增强Windows上所有浏览器的字体渲染。

仔细检查您是否poppler-data安装了CJK字符。

仔细检查你已经运行sudo make install,或者pdf2htmlEX可能无法正确执行

最简单的情况

 

假设你有一个PDF文件pdf/test.pdf,只需运行

pdf2htmlEX命令是上文通过docker做的软连接容器

pdf2htmlEX --zoom 1.3 pdf/test.pdf

test.html在当前目录中生成一个HTML文件。

 

1.1.3.2  高级

pdf2htmlEX -f 3 -l 5 --fit-width 1024 --bg-formatjpg pdf/test.pdf

将仅转换第3,4页和第页,并将页宽调整为1024像素。背景图像将以JPEG格式生成。

1.1.3.3  对于发布商

pdf2htmlEX --embed cfijo --dest-dir outpdf/test.pdf

test.htmlout目录中产生一个和附带的文件,以这种方式将所有资源(字体,图像,CSSJavaScript)存储在分离的文件中,以便查看器可以更好地利用浏览器缓存。

1.1.3.4  适用于高级发布商

pdf2htmlEX --embed cfijo --split-pages 1 --dest-dirout --page-filename test-%d.page pdf/test.pdf

将执行类似的操作,但每个单独的页面都存储在一个单独的文件中。命令行中指定的文件名称等test-0.pagetest-1.page依此类推。仍然有一个test.html通过ajax动态加载页面。以这种方式,发布商被完全控制,谁可以按照他们喜欢的方式组织页面,例如实现延迟页面加载。

1.1.3.5  终极之手

pdf2htmlEX --fallback 1 pdf/test.pdf

也会产生一个单一的test.html,然而,它包括图像和隐藏的文本。这种模式提供最大的精度和兼容性,代价是更大的文件大小。仅当pdf2htmlEX无法正确处理您的文件时,才能使用此模式。

自发研究

 pdf2htmlEX --fallback  1  --fit-width 1024 --fit-height 720  --bg-format jpg test.pdf

1.1.3.6  更多

只要记住man pdf2htmlEXpdf2htmlEX --help永远是你最好的朋友。