Pandoc 首次使用小记

Pandoc 首次使用小记_第1张图片
配图1

在过去近半年的时间里,由于朋友不擅长网络和电脑操作,但又想借助自媒体的传播效应进行推广,我就通过“”为他整理并推广了近200篇文章。昨日,朋友突然提出想将过去在整理的文章集合成 Word 文档,记忆中好像 Markdown 文件可以转换为 Word 文档,帮人帮到底,我也就应承了下来。以下记载了我的转换过程:

朋友是文化圈的,对文档格式要求还是中规中矩的。而我自己对文章的格式要求不高,Markdown 格式就足够了,所以过去也没过多注意这些事情,只记得曾看到过 Markdown 转换为 Word 的文章标题,就借着模糊的记忆,搜索了一番。发现 Pandoc 这种软件比较中意。

第一步:在“”的『设置』/『账号管理』,下载我的所有文章。(约2.20M,245个.md 格式文章)

第二步:下载并安装Pandoc,这个软件没有常规的界面,只能通过命令行模式进行操作。

第三步:在电脑中用『资源管理器』打开.md文集文件夹,鼠标移至右侧窗口(文件列表)空白处,按住键盘上『shift』,鼠标右键菜单『在此处打开命令窗口』,打开黑底白字的 CMD 命令行窗口。(见配图2)

Pandoc 首次使用小记_第2张图片
配图2

第四步:在 CMD 命令窗口光标闪烁处输入“dir > filelist.txt”(将dir的结果输出到 filelist.txt 文件中,文件名可随意),回车。如下粗体文字:

F:\\转换工具\ALL\黄堡文化研究> dir > filelist.txt

第五步:.md文集中会多出一个 filelist.txt 文件,使用 Notepad ++ 打开这个文件。此时能看到该文件夹下的所有文件列表信息,包括时间,文件名,扩展名……

第六步:将 filelist.txt 中不需要的字符删除,只保留每行的文件名和扩展名(配图3中红框中的信息)(提醒:在 Notepad++ 中,按住键盘上的『ALT』键,鼠标可以按“列”选中文字,再按『Delete』键删除文件创建时间等信息)。

Pandoc 首次使用小记_第3张图片
配图3

第七步:用 Excel 打开修正过内容的 filelist.txt 文档(保持扩展名仍为.txt)。

  • 插入A列,手工输入配图4中蓝色部分(写入一行,拖动复制);
  • 在C列输入“-o”(减号和字母o),注:Excel 会将 -o 自动修正为“=-o”,所以应该输入“'-o”(单引号+减号+字母o);
  • 将原文件名(B列)赋值到D列(浅红色),并修改D列中的扩展名为 .docx(替换法修改)。
  • 修改后依旧按 .txt 格式保存。
Pandoc 首次使用小记_第4张图片
配图4

第八步:再使用 Notepad++ 打开修改后的 filelist.txt 文档,

  • 将文中的制表符(正则表达式为\t) 字符替换为空格;
  • 将文中的-o替换为“ -o ”(空格+减号+字母o+空格);
  • 保存。

第九步:在 filelist.txt 文件夹中再次打开 CMD,将修整好格式的 filelist.txt 内容复制(Ctrl+V),粘贴到 CMD 窗口。你会看到 CMD 自动一行一行地执行 md 转换 docx 过程。如配图5

Pandoc 首次使用小记_第5张图片
配图5

小记:本打算将 filelist.txt 改为 .bat 文档,结果没成功,可能每行的行尾字符(回车符)没处理。只是已经将 filelist.txt 内容一股脑复制并粘贴到 cmd 窗口,且已经执行了,也就罢了。

十几年没摸 cmd 命令了,有些生疏。初次使用 pandoc ,有待提高。

另,导出的 md 文档内部没有文件标题,标题以文件名形式存在。这个很不方便。

2017/04/10

你可能感兴趣的:(Pandoc 首次使用小记)