用Python实现去掉文章中特定的段落

有一份试题,每个问题以QUESTION NO开始,然后是该题的答案,以Answer:开始。
为了摘出一份只包含问题,不包含答案的试题,尝试用ultraedit的正则表达式替换,
但不支持跨行替换。
于是写了下面的Python程序。
from sys import*
fp=open(argv[1],'r')
fo=open(argv[2],'w')
a=fp.readline()
sym=0
while a!='':
 if a[0:len(argv[3])]==argv[3]:
  sym=1
 if sym==1 and a[0:len(argv[4])]==argv[4]:
  sym=0
 if sym==0 :
  fo.write(a)
 a=fp.readline()
fo.close()
fp.close()
把它命名为gjj.py
然后在windows xp控制台窗口输入命令行:
python gjj.py tk007.txt out007.txt "Answer:" "QUESTION NO"
就可以把tk007.txt中的答案部分删除。

 

你可能感兴趣的:(用Python实现去掉文章中特定的段落)