pdf文件具体分析

%PDF-1.0 
文件头,说明符合PDF1.0规范 

  Catalog(根对象)

1 0 obj
<< 
/Type /Catalog
/Pages 1 0 R
/Outlines 2 0 R
>>
endobj

/Pages 指明页面组对象是哪个 ,这里说明Pages对象编号是1

Outline

2 0 obj
<<
/Type /Outlines
/Count 0
>>
endobj

  Pages(页面组对象)

/Count 1说明页码数量为1,/Kids [4 0 R]说明页的对象为4, 这里要说明的是如果有多个页面,就多个页面直接连续下去,比如说/Kids [4 0 R 10 0 R], 就说明该PDF的第一页的对象号是4,第二页的对象号是10。 

3 0 obj
<<
/Type /Pages 
/Kids [ 4 0 R ] 
/Count 1
>>
endobj

 Page(页对象)

/Parent 3 0 R 父对象的对象号是3,/Resource << /Font << /F1 7 0 R >> /Procset 6 0 R >> 该页所包含的资源,对象中的字体类型对象是 7,内容类型对象是6。/MediaBox [0.000000 0.000000 595.276000 841.890000 ] 以像素为单位,显示该页的大小。/Contents 5 0 R 页面内容对象编号是5

4 0 obj
<< 
/Type /Page
/Parent 3 0 R
/Resource << /Font << /F1 7 0 R >> /Procset 6 0 R >>
/MediaBox [0.000000 0.000000 595.276000 841.890000 ]
/Contents 5 0 R 
>>

  /Length 303 说明stream对象为字节数为303,stream说明是一个对象流

5 0 obj
<< /Length 303 >> stream
xœÕTÁn‚@½ó輻.»Ë.®×ÖjâI[MÔKi•6Ùø÷h@›¥:dÂdvÞ̼ÍÎô€“Á‚cJþŽÅŠ^1ù„<õî#øc!¯Ñ‘Ç]»tu‚ŸçGFL«*\o=ÿ%RåÞœç
ÎÇ6ÁÓÄo[»j][M‘‚FÒ˜â³4±ÌJÃýs
\0ÃUµOŒEï-ɲ6ÏŠ¸¿B4-óÉl`ÂfÀ>ùü5§?¶ƒ®ƒËœ˜©8QK)uCh–Û¤Hb¼î=ÌFc,{ÖZöµþˆ7,/Òe¿fÛEÔd·øȾб.º¦c¼tÀ—+×8ï ˜¦d†l(Ól†ç®“Ýu­èw¥´)SwB°¡*ר…Ýj>Ä‘î;háÌfCÂ
endstream

 /PDF /Text]说明PDF的内容类型仅仅为文本,如果有图片则为[/PDF /Image] 

6 0 obj
[/PDF /Text]
Endobj 

字体对象

7 0 obj 
<< 
/Type /Font 
/Subtype /Type1 
/Name /F1 
/BaseFont /Helvetica 
>> 
endobj

pdf文件解析过程

pdf文件具体分析_第1张图片

 

pdf属性

1、标题 (itle)  2、作者 (author) 3、主题(subject)4、关键词(keywords)5、创建者(creator)6、producer(生产者)
7、创建时间(creationData)8、modDate(修改时间)

 

你可能感兴趣的:(pdf文件具体分析)