用正则表达式从备份的自选集文稿里提取诗词目录


    用正则表达式从备份的自选集文稿里提取诗词目录
    
   

    1、合并标题上面的空行为一行。
    文稿中每个诗词标题上面有的有一个空行,有的有两个空行,要保证标题上面有一个空行,如果有两个以上的空行,请将多余的空行删除。
    2、删除每一行行首的空格。
    用EmEditor打开文本,点“搜索”/“替换”,在弹出的“替换”对话框中的“查找”栏里输入“^\s*”,在“替换为”栏里什么也不输入,勾选“使用正则表达式”前面的复选框,点“替换全部”,文本中行首前面的空格即被删除。
    3、为标题上面的每一个空行添加“ ”。
    点“搜索”/“替换”,在弹出的“替换”对话框中的“查找”栏里输入“^\n[\s\·]*\r”,在“替换为”栏里输入“ ”,勾选“使用正则表达式”前面的复选框,点“替换全部,即在每个标题前面添加“ ”。此时标题上面已无空行。
    4、将文本中的所有行合并为一行。
    点“搜索”/“替换”,在弹出的“替换”对话框中的“查找”栏里输入“\n”,在“替换为”栏里什么也不输入“,勾选“使用正则表达式”前面的复选框,点“替换全部”,在查看里勾选“不换行”,所有行即被合并为一行。
    5、将文本中的单行扩展为多行
    点“搜索”/“替换”,在弹出的“替换”对话框中的“查找”栏里输入“ ”,在“替换为”栏里输入“\n”,勾选“使用正则表达式”前面的复选框,点“替换全部”,文本中的单行即被扩展为多行,而且每行都以每首诗的标题为首。
    6、在每首诗的标题前面添加题号和换行符。
    打开F:\add根目录,并将其重命名为a.txt。新建一个名为b.txt的文本文件。
    打开AddLineNum003.bat,java程序便自动在每首诗的标题前面添加题号“第 几 首 ”和换行符 。将添加题号和换行符后的文本另存为b.txt。
    7、用EmEditor打开F:\add\b.txt,在每首诗的标题后面添加换行符“ ”。。
    打开F:\add\b.txt的文本文件。
    点“搜索”/“替换”,在弹出的“替换”对话框中的“查找”栏里输入“2009-”,在“替换为”栏里输入“ 2009-”,勾选“使用正则表达式”前面的复选框,点“替换全部”,在每首诗的标题后面添加换行符“ ”。
    8、在每首诗的写作时间后面添加换行符“ ”。。
    打开F:\add\b.txt的文本文件点“搜索”/“替换”,在弹出的“替换”对话框中的“查找”栏里输入“:[0-9][0-9]”,在“替换为”栏里输入“:00 ”,勾选“使用正则表达式”前面的复选框,点“替换全部”,在每首诗的标题后面添加换行符“:00 ”。
    9、将标题行和写作时间单独占一行。
    点“搜索”/“替换”,在弹出的“替换”对话框中的“查找”栏里输入“ ”,在“替换为”栏里输入“\n”,勾选“使用正则表达式”前面的复选框,点“替换全部”,所有标题行和写作时间行即占一行。。
    10、将诗句行设为每两句占一行。
    点“搜索”/“替换”,在弹出的“替换”对话框中的“查找”栏里输入“。”,在“替换为”栏里输入“。 ”,勾选“使用正则表达式”前面的复选框,点“替换全部”,文本中每一首中的诗句行都编排为每两句占一行。
    以“?”和“!”结尾的诗句,所剩较少,可以手工编排,当然,也可以替换为换行符。至此,即可进行下一步,提取目录。
    11、打开F:\add根目录下的a.txt。全选,复制。打开word2003,新建一个名为武臣文苑自选集(2009年).doc的文件。
    点击左下角的大纲视图按钮,弹出武臣文苑自选集(2009年).doc大纲视图界面。
    12、通过通配符查找所有诗词标题。
    在“编辑”/“查找”/“查找和替换”/“查找”的“查找内容”里输入“第*首”,勾选“突出显示所有在该范围查找的项目”,点“高级”,勾选“使用通配符”,点“查找全部”,文本中每一首诗的标题均被点亮。然后,打开大纲左上角“文本内容”,勾选“1级”,所有加序号的标题即被选中,标题前显示“空心十字”标记。
    13、生成目录。
    用鼠标选定光标所在当前页首行位置。点“插入”\“引用”\“索引和目录”,点“目录”,勾选“显示页码”和“页码右对齐”复选框,选择“制表符前导符(B)”中的第一条虚线,格式设为“模版”,显示级别设为“1”,删除使用超链接而不使用页码,点确定目录即刻生成。
    14、返回左下角,点“页面视图”图标,查看生成的目录效果。
    15、将目录从文本中复制下来,新建一个目录文件,将目录单独保存,以备后用。

 

你可能感兴趣的:(正则)