1. 首先要解决文件格式问题
安装openoffice或者librioffice
用法:
soffice --headless --convert-to 目标格式(如pdf) 转格式文件 --outdir 目标文件夹
CMD 用法
适合单个文件转换,或者编程调用。
./soffice --headless --convert-to pdf /home/xx.docx --outdir /home/xx.pdf
/opt/openoffice4/program/soffice --headless --convert-to pdf /home/xx.docx --outdir /home/xx.pdf
soffice.exe --headless --convert-to pdf E:\temp\xx.docx --outdir E:\temp\xx.pdf
“C:\Program Files\LibreOffice\program\soffice.exe" --headless --convert-to pdf --outdir pdf c.1.1.3温人医办字〔2015〕89号.doc
powershell用法
可以直接批量转换
ls -Name *.doc | foreach {& "C:\Program Files\LibreOffice\program\soffice.exe" --headless --convert-to pdf --outdir pdf $_}
文件命名规则和转换
文件名规则:文件中包括中文题目和英文、数字唯一号
举例:
c.1.2.1中高级学分授予办法.pdf
1.中高级学分授予办法.pdf
中高级学分授予办法-20191204.pdf
1.获取文件列表:
cmd:
dir /b >name.txt
powershell:
ls -Name >name.txt
2.文件名处理
查找目标:
([\.\-\da-zA-Z]+)(.+)\.pdf
替换目标:
\\includepdf[addtotoc={1,section,1,$2,$1},pages={-}]{$1}
替换.
- 文件批量重命名
latex转化,文件名中不能包括中文和.。
ls -name | foreach { $m=$_;$n=$_ -Replace '([\.\-\da-zA-Z]+).+','$1';$n=$n -Replace('\.','');$n="$n.pdf";© $m $n}
4.latex 文件代码
\documentclass[openany]{book}
\usepackage[UTF8]{ctex}
\usepackage[colorlinks]{hyperref} %链接需要
\usepackage{pdfpages} %导入pdf
\pdfminorversion=7
\usepackage[margin=0.5in,includehead,includefoot]{geometry} %设置边距
\geometry{bottom=0.2cm}
\begin{document}
\tableofcontents %生产目录
\thispagestyle{empty}% 当前页不显示页码
\setcounter{page}{0}
\includepdfset{pagecommand={\thispagestyle{plain}}}
\includepdf[addtotoc={1,section,1,调整继续医学教育委员会成员文件,c111},pages={-}]{c111}
\includepdf[addtotoc={1,section,1,院领导专题会议记录,c112},pages={-}]{c112}
\includepdf[addtotoc={1,section,1,温人医办字〔2015〕89号,c113},pages={-}]{c113}
\includepdf[addtotoc={1,section,1,中高级学分授予办法,c121},pages={-}]{c121}
\includepdf[addtotoc={1,section,1,初级继续教育管理文件,c122},pages={-}]{c122}
\includepdf[addtotoc={1,section,1,住院医师院内学分说明,c123},pages={-}]{c123}
\includepdf[addtotoc={1,section,1,举办继教项目有关规定,c124},pages={-}]{c124}
\includepdf[addtotoc={1,section,1,继教项目经费支持文件,c125},pages={-}]{c125}
\includepdf[addtotoc={1,section,1,继教报销经费支持文件,c126},pages={-}]{c126}
\includepdf[addtotoc={1,section,1,年会议费培训费文件,c127-2018},pages={-}]{c127-2018}
\includepdf[addtotoc={1,section,1,继续教育十三五规划,c131},pages={-}]{c131}
\includepdf[addtotoc={1,section,1,继续教育实施方案,c132},pages={-}]{c132}
\includepdf[addtotoc={1,section,1,继教工作总结和计划,c133-2017-2019},pages={-}]{c133-2017-2019}
%文件尾巴
\end{document}
6.生成的PDF 目录