浏览器书签(bookmarks)结构格式分析

浏览器之间能自由的导入和导出书签,是因为统一了书签的结构,了解书签结构格式,不仅可以方便我们对导出的书签进行编辑,合并,替换等等,还可以自己手工创建适合各种浏览器的书签。这里我们导出google 浏览器的书签作为参考分析:

< !DOCTYPE NETSCAPE-Bookmark-file-1>
//注释,无用
< META HTTP-EQUIV= "Content-Type" CONTENT= "text/html; charset=UTF-8"> //声明编码,会影响书签导入
< TITLE>Bookmarks< /TITLE> //书签标题,显示在浏览器上,不影响书签导入
< H1>Bookmarks< /H1> //内容标题,不影响书签导入
< DL>< p//
表示一个引用的开始
        < DT>< H3 ADD_DATE= "1265072416" LAST_MODIFIED= "1265091415">常< /H3> //
表示定义的开始,这里定义一个目录
        < DL>< p>
            < DT>< A HREF= "http://www.bj.chinamobile.com/" ADD_DATE= "1152858239">北京移动< /A> //书签,这里也是用的

            < DT>< A HREF= "http://home.live.com/" ADD_DATE= "1152858239">主页 — Windows Live< /A>
        < /DL>< p>
        < DT>< H3 ADD_DATE= "1265072416" LAST_MODIFIED= "1265078685">查< /H3>
        < DL>< p>
            < DT>< A HREF= "http://www.who.is/" ADD_DATE= "1152858239"> Whois< /A> // 书签,这里也是用的

        < /DL>< p>
< /DL>< p>

注意上边//后面的注释,从google的书签我们可以看出,引用书签的html标签主要为

,其中
引入开始,
标注书签或者文件夹,所以我们可以总结出书签的结构格式为:

<!DOCTYPE NETSCAPE-Bookmark-file-1>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=UTF-8">
<TITLE>Bookmarks</TITLE>
<H1>Bookmarks</H1>
<DL> //引起书签列表
<DT><A HREF="HTTP://WWW.GSST.NAME">书签0</A></DT>  //无目录书签
  <DT><H3>书签目录1</H3></DT>
  <DL>
    <DT><A HREF="HTTP://WWW.GSST.NAME">书签1</A></DT
    <DT><A HREF="HTTP://WWW.GSST.NAME">书签2</A></DT>
  </DL>
  <DT><H3>书签目录2</H3></DT>
  <DL>
    <DT><A HREF="HTTP://WWW.GSST.NAME">书签3</A></DT>
    <DT><A HREF="HTTP://WWW.GSST.NAME">书签4</A></DT>
  </DL>
  <DT><A HREF="HTTP://WWW.GSST.NAME">书签5</A></DT>
</DL>

因为

为块标签,所以我都加了闭合标签
以求更加标准。导入google浏览器试试,非常好,没有乱码,结构清晰,如下:

你可能感兴趣的:(系统维护)