正则表达式统计PDF文档的页数

在记事本中打开PDF文件,可以发现文件中的每一页都有一个特定的标记:"/Type /Page" (根据PDF版本的不同,在两个词之间可能带有空格)。所以,只需要计算这个标记在文件里出现了多少次。

首先需要使用FileStream 打开pdf文件,然后使用StreamReader将文档内容作为字符串读取。

FileStream fs = new FileStream(@"c:/a.pdf", FileMode.Open, FileAccess.Read); StreamReader r = new StreamReader(fs); string pdfText = r.ReadToEnd();

 


一旦获取了pdf文本,接下来需要做的就是使用正则表达式计算:

"/Type /Page" 标记出现的次数。

Regex rx1 = new Regex(@"/Type/s*/Page[^s]"); MatchCollection matches = rx1.Matches(pdfText); MessageBox.Show("The PDF file has " + matches.Count.ToString() + " page(s).";

 

 

 

 

 

有志于学,虽草庐中应可知天下事!

正则表达式统计PDF文档的页数_第1张图片

你可能感兴趣的:(c,正则表达式,String,File,文档,regex)