pdf转latex

有时候,我们想通过latex对pdf文件进行再编辑,但是pdf的源文件找不到了,或者pdf的作者不提供源文件,该怎么办呢?


(一)借助中间格式,用pandoc转化为latex


先把pdf转为pandoc支持的格式,如docx、html。Adobe Acrobat可做。转存之前,可以用编辑软件删去pdf文件中的行号,页眉,页脚,页码,等以免影响转化效果。


pandoc可以把转存后的文件转化为latex。pandoc介绍参见:http://blog.csdn.net/communix/article/details/49965233


(二)用Aspose.Pdf,可以把pdf直接转化为latex


商业程序。https://www.evget.com/product/565


无论哪种方法,只能大体复原正文的文字部分。图片可以用Adobe Acrobat从pdf原文裁剪,并存为新的图片文件。表格数据需要手工重新制表。参考文献需要重新编写bib。而公式几乎不可能复原。

你可能感兴趣的:(pdf,latex,转转转)