URI URL URN

转载1:

        对于URL,大家都比较熟悉,其他两个词就比较陌生了。URI、URL和URN是识别、定位和命名互联网上的资源的标准途径。

        1989年Tim Berners-Lee发明了互联网(World Wide Web)。WWW被认为是全球互连的实际的和抽象的资源的集合--它按需求提供信息实体--通过互联网访问。实际的资源的范围从文件到人,抽象的资源包括数据库查询。
      因为要通过多样的方式识别资源(人的名字可能相同,然而计算机文件只能通过唯一的路径名称组合访问),
所以需要标准的识别WWW资源的途径。为了满足这种需要,Tim Berners-Lee引入了标准的识别、定位和命名的途径:URI、URL和URN。 
   在这个体系中的URI、URL和URN是彼此关联的。URI的范畴位于体系的顶层,URL和URN的范畴位于体系的底层。这种排列显示 URL和URN都是URI的子范畴,  URI表示的是统一的资源标识, URL表示的是统一的资源定位, URN表示的是统一的资源命名。

转载2:
        1、什么是URI
         Web上可用的每种资源 - HTML文档、图像、视频片断、程序等,由一个通过通用资源标志符(Universal Resource Identifier, 简称'URI') 进行定位。
         URI一般由三个部分组成:
         访问资源的命名机制。
         存放资源的主机名。
         资源自身的名称,由路径表示。
         考虑下面的URI,它表示了当前的HTML 4.0 规范:
         http://www.webmonkey.com.cn/html/html40/
         这个URI是这样的:这是一个通过HTTP协议访问的资源,位于主机www.webmonkey.com.cn上,通过路径"/html/html40" 访问。在HTML文档中其它资源包括"mailto" (收发email) 和"ftp" (FTP访问)。
         这是URI的另一个例子,指向一个用户的邮箱:
         <a href = 'mailto:[email protected]'>Joe Cool</a>
          注:大多数读者可能熟悉"URL",而不是"URI"。URL是URI命名机制的一个子集。

         片断标志符
         有的URI指向一个资源的内部。这种URI以"#"结束,并跟着一个anchor标志符(称为片断标志符)。例如,下面是一个指向section_2的URI:
          http://somesite.com/html/top.htm#section_2
          相对URI
          相对URI不包含任何命名规范信息。它的路径通常指同一台机器上的资源。相对URI可能含有相对路径(如:“..”表示上一层路径),还可以包含片断标志符。
          为了说明相对URI,假设我们有一个基本的URI http://www.acme.com/support/intro.htm
          下面的链接中使用了相对URI:
          <a href = 'suppliers.htm'>Suppliers</a>
          它扩展成完全的URI就是 "http://www.acme.com/support/suppliers.htm",
          下面是一个图像的相对URI:
           <img src = '../icons/logo.gif' alt = 'logo'>
           它扩展成完全的URI就是 "http://www.acme.com/icons/logo.gif"。
           在HTML中,URI被用来:
           链接到另一个文档或资源(参看A和LINK元素)。
           链接到一个外部样式表或脚本(参看LINK和SCRIPT元素)。
           在页内包含图像、对象或applet(参看IMAG、OBJECT、APPLET和INPUT元素)。
           建立图像映射(参看MAP和AREA元素)。
           提交一个表单(参看FORM元素)。
           建立一个框架文档(参看FRAME和IFRAME元素)。
           引用一个外部参考(参看Q、BLOCKQUOTE,INS和DEL元素)。
           指向一个描述文档的metadata(参看HEAD元素)。

           2、什么是URL:
           URL是Uniform Resource Location的缩写,译为“统一资源定位符”。通俗地说,URL是Internet上用来描述信息资源的字符串,主要用在各种www客户端程序和服务器端程序上,特别是著名的Mosaic,采用URL可以用一种统一的格式来描述各种信息资源,包括文件、服务器的地址和目录等。
  •   URL的格式
            URL的格式由下列三部分组成:
            第一部分是协议(或称为服务方式);
            第二部分是存有该资源的主j机IP地址(有时也可以包括端口号);
            第三部分是主机资源的具体地址。如目录和文件名。
            第一部分和第二部分之间用 “://” 符号隔开,第二部分和第三部分用 “/” 符号隔开。第一部分和第二部分是不可缺少的,第三部分有时可以省略。
  •   URL示例
            文件的URL:
            用URL表示文件时,服务器方式用file表示,后面要由主机IP地址、文件的存储路径(即目录)和文件名等信息。有时可以省略目录和文件名,但 “/” 符号不能省略。
            例一: file://ftp.yoyodyne.com/pub/files/foobar.txt
            代表存放主机 ftp.yoyodyne.com 上的pub/files 目录下的一个文件,文件名是 foobar.txt。
            例二: file://ftp.yoyodyne.com/pub
            代表主机 ftp.yoyodyne.com 上的目录/pub。
            例三: file://ftp.yoyodyne.com/
            代表主机 ftp.yoyodyne.com/ 上的根目录。

            Gopher的URL:
            Gopher服务器有可能使用特殊的端口,在这种情况下,逐级IP地址与端口之间要用 “:” 隔开。
            例一: gopher://gopher.yoyodyne.com/
            表示主机 gopher.yoyodyne.com/ 上的gopher服务器。
            例二: gopher://gopher.banzai.edu:1234
            表示主机 gopher.banzai.edu 上的gopher服务器,在端口1234上。

            网络新闻的URL:
            利用URL表示网络新闻组时,如果是usenet的话只要指定出新闻组的名字即可。
            例如:news:rec.gardening
            表示usenet上的rec.gardening新闻组(园艺)。

            HTTP的URL:
            使用超级文本传输协议HTTP,提供超级文本信息服务的资源。
            例一: http://www.peopledaily.com.cn/channel/welcome.htm
            其计算机域名为 www.peopledaily.com.cn。超级文本文件(文件类型为.html)是在目录/channel下的welcome.htm。这是中国人民日报的一台计算机。
            例二: http://www.rol.cn.net/talk/talk1.htm
            其计算机域名为 www.rol.cn.net。超级文本文件(文件类型为.htm)是在目录/talk下的talk1.htm。这是瑞得聊天室的地址,可由此进入瑞得聊天室的第一室。

             URI、URL和URN之间的区别与联系
             URI:Uniform Resource Identifier, 统一资源标识符;
             URL: Uniform Resource Locatior, 统一资源定位符;
             URN: Uniform Resource Name, 统一资源名称。
             其中,URL,URN是URI的子集。
             Web上地址的基本形式是URI,它代表统一资源标识符。有两种形式:
             URL:目前URI的最普遍形式就是无处不在的URL或统一资源定位器。
             URN:URL的一种更新形式,统一资源名称(URN,Uniform Resource Name)不依赖于位置,并且有可能减少实效连接的个数。但是其流行还需要假以时日,因为它需要更精密的软件的支持。
             URI是以某种统一的(标准化的)的方式表示资源的简单字符串
             URI一般由三部分组成:
             1、访问资源的命名机制。
             2、存放资源的主机名。
             3、资源自身的名称,由路径表示。
             典型情况下,这种字符串以scheme(命名URI的名字空间的标识符——一组相关的名称)开头,语法如下:
             [scheme:]scheme-specific-part
             URI以scheme和冒号开头。Scheme用大写/小写字母开头,后面为空或者跟着更多的大写/小写字母、数字、加号、减号和点号。冒号把scheme与scheme-specific-part分开了,并且scheme-specific-part的语法和语义(意思)有URI的名字空间决定。如下面的例子:
             http://www.cnn.com, 其中http是scheme,//www.cnn.com是 scheme-specific-part,并且它的scheme与scheme-specific-part被冒号分开了。
             URI有绝对和相对之分,绝对的URI指以scheme(右面跟着冒号)开头的URI。前面提到的http://www.cnn.com就是绝对的URI的一个例子,其它的例子还有 mailto:[email protected]、news:comp.lang.java.help和xyz://whatever。你可以把绝对的URI看作是以某种方式引用某种资源,而这种方式对标识符出现的环境没有依赖。如果使用文件系统作类比,绝对的URI类似于从根目录开始的某个文件的路径。与绝对路径的URI不同的,相对的URI不是以scheme(后面跟着冒号)开始的URI。它的一个例子是articles/articles.html,你可以把相对的URI看作是以某种方式引用某种资源,而这种方式依赖于标识符出现的环境。如果用文件系统作类比,相对的URI类似于从当前目录开始的文件路径。

             URL是Uniform Resource Location的缩写,译为“统一资源定位符”。通俗地说,URL是Internet上用来描述信息资源的字符串,主要用在各种www客户端程序和服务器端程序上,特别是著名的Mosaic。采用URL可以用一种统一的格式来描述各种信息资源,包括文件、服务器的地址和目录等。
             URL的格式由下列三部分组成:
             第一部分是协议(或称为服务方式);
             第二部分是存有该资源的主机IP地址(有时也包括端口号);
             第三部分是主机资源的具体地址,如目录和文件名等。
             第一部分和第二部分之间用“://”符号隔开,第二部分和第三部分用“/”符号隔开。第一部分和第二部分是不可缺少的,第三部分有时可以省略。
             目前最大的缺点是当信息资源的存放地点发生变化时,必须对URL作相应的改变。因此人们正在研究新的信息资源表示方法,例如:URI(Universal Resource Identifier) 即“通用资源标识符” (参见RFC 1630)、URN(Uniform Resource Name) 即“统一资源名”和URC(Uniform Resource Citation) 即 “统一资源引用符”等。
             URI目前还处在进一步的研究当中,研究方向就是弥补URL目前存在的缺点。

             相关rfc

  • RFC 1738  PS  T. Berners-Lee, L. Masinter, M. McCahill Uniform Resource Locators (URL)  12/20/1994. (Liczba stron --- 25)
  • RFC 1808  PS  R. Fielding, Relative Uniform Resource Locators  06/14/1995. (Liczba stron --- 16) 
  • RFC 1700  J. Reynolds, J. Postel ASSIGNED NUMBERS  10/20/1994. (Liczba stron --- 230) (Uniewa?nia RFC1340) (STD 2)
  • RFC 1630  T. Berners-Lee, Universal Resource Identifiers in WWW: A Unifying Syntax for the Expression of Names and Addresses of Objects on the Network as used in the World-Wide Web  06/09/1994. (Liczba stron --- 28)
  • RFC 2017  PS  N. Freed, K. Moore, A. Cargille, Definition of the URL MIME External-Body Access-Type  10/14/1996. (Liczba stron --- 5) 
  • RFC 2141  PS  R. Moats URN Syntax  05/05/1997. (Liczba stron --- 8)
  • RFC 2056  PS  R. Denenberg, J. Kunze, D. Lynch, Uniform Resource Locators for Z39.50  11/05/1996. (Liczba stron --- 7)

你可能感兴趣的:(html,Web,互联网,Scheme,网络协议)