URI和URL、URN的作用和区别

前言

我们都知道URL是使用Web浏览器等访问Web页面时需要输入的网页地址。而对URI、URN的认识可能很少,更有甚者会像我一样,把URI与URL搞混,还以为是一个东西的不同别名。
URI和URL、URN的作用和区别_第1张图片
其实URI是URL与URN的超集,URI包括URL和URN这两个子集。今天我们就来详细探究一下URI与URL、URN。

URL

URL统一资源定位系统(uniform resource locator)在百度百科上的定义是因特网的万维网服务程序上用于指定信息位置的表示方法。
它最初是由蒂姆·伯纳斯·李发明用来作为万维网的地址。现在它已经被万维网联盟编制为互联网标准RFC1738。通俗来讲就是让我们定位互联网上的各种资源。例如我们经常浏览网站看到的每一个网页或图片都具有唯一的URL,即通过URL地址可以成功的访问到,且这些URL地址都是唯一的。

RFC

这里先了解下RFC(Request for Comments,征求修正意见书),是一系列以编号排定的文件。文件收集了有关互联网相关信息,以及UNIX和互联网社区的软件文件。可以说RFC是互联网的设计文档,用来指定HTTP协议技术标准的文档,若不按照RFC标准执行,就有可能导致无法通信的状况。例如,有一台Web服务器内的应用服务没有遵照RFC的标准实现,那Web浏览器就很可能无法访问这台服务器了。

但也不是所有的应用程序都符合RFC,存在某些应用程序因客户端或服务器端的不同,而未遵照RFC标准,反而将自成一套的“标准”扩展的情况。

绝对URL与相对URL的区别

绝对URL:包含了指向目录或者文件的完整信息,包括模式,主机名和路径。对于FTP站点以及几乎所有的不使用HTTP协议的URL,都应该使用绝对的URL。

相对URL :只给出一个参照位置,用于指示资源相对于当前页面的位置。
例如我们一直在某一个网站(website)对应的url地址——https://baike.baidu.com/item/,此时我们想访问
https://baike.baidu.com/item/URI.html
https://baike.baidu.com/item/URL.html
利用相对定位和相对URL,我们就可以直接写成
website/URI.html
website/URL.html

URN

URN (Uniform Resource Name 统一资源名称),通过特定命名空间中的唯一名称或ID来标识资源,但不指定如何访问资源
ISBN:987-7-302-14751-0是一个URN,因为它唯一地标识某一本书,但它不是URL,因为它没有指定如何检索该书。
URI和URL、URN的作用和区别_第2张图片

URN的历史

1997年的RFC2141于中定义了URN,期望为资源提供持久的、位置无关的标识方式,并允许简单地将多个命名空间映射到单个URN命名空间。这样一个URI的存在并不意味着被标识的资源一定是可用的,但它仍然需要保持全局唯一和持久,即使资源已经不存在了或变得不可用。
自从2005年RFC 3986发布,这一术语的使用已被限制更少的“URI”取代。这是W3C和IETF联合组成的工作组所提议的。URN和URL都已经是URI的一种,而且特定情况下URL可能同时拥有名字(URN)和位置(URL)。

在1990年,URN作为一个元数据框架,原本被期望和URL、URC(统一资源特征)一起组成一个第三方互联网信息架构。然而URC一直停留在理论阶段,随之更晚出现的其他技术(例如资源描述框架)取代了它们。

URI

URI(统一资源标识符),该种标识允许用户对任何(包括本地和互联网)的资源通过特定的协议进行交互操作。URI由包括确定语法和相关协议的方案所定义。Web上可用的每种资源 -HTML文档、图像、视频片段、程序等由一个通用资源标识符进行定位。

1998年随着RFC2396的发表,URI文法形成了独立的标准,同时RFC 1630和1738中关于URI和URL的许多部分也得到了修订和增补。新RFC修改了“URI”中“U”的含义:它开始代表统一(Uniform)而不再是通用(Universal)

URI是Uniform Resource Identifier 的缩写。RFC2396分别对这3个单词进行了如下定义:

Uniform

规定统一的格式可方便处理多种不同类型的资源,而不用根据上下文环境来识别资源指定的访问方式。另外,加入新增的协议方案(如http:或ftp:)也更容易。

Resource

资源的定义是“可标识的任何东西”。不仅是文档文件,图像或服务(例如某地天气预报)等能够区别于其他类型的,全都可作为资源。另外,资源不仅可以是单一的,也可以是多数的集合体。

Identifier

表示可标识的对象。也称为标识符。

综上所述,URI就是由某个协议方案表示的资源的定位标识符。协议方案是指访问资源所使用的协议类型名称。采用HTTP协议时,协议方案就是http。除此之外,还有ftp、mailto、telnet、file等。标准的URI协议方案有30种左右,由隶属于国际互联网资源管理的非营利社团ICANN(互联网名称与数字地址分配机构)的IANA(互联网号码分配局)管理颁布。

URI用字符串标识某一互联网资源,而URL表示资源的地点(互联网上所处的位置)。可见URL是URI的子集,所以URL一定是URI,而URI不一定是URL

URI格式

RFC3396URI通用语法列举的例子:
http://www.ietf.org/rfc/rfc2396.txt
ftp://ftp.is.co.za/rfc/rfc1808/txt
tel:+1-816-555-1212
telnet://192.0.2.16:80/

表示指定的URI,要使用涵盖全部必要信息的绝对URI、绝对URL以及相对URL。相对URL,是指从浏览器中基本URI处指定的URL,前面已经讨论过它们的区别,下面我们来看看绝对URI的格式。

URI和URL、URN的作用和区别_第3张图片

使用http:或https:等协议方案名获取访问资源时要指定协议类型。不区分字母大小写,最后加一个冒号:。也可使用data:或JavaScript:这类指定数据或脚本程序的方案名。

登录信息(认证)
指定用户名和密码作为从服务器端获取资源时必要的登录信息(身份认证)。此项是可选项。

服务器地址
使用绝对URI必须指定待访问的服务器地址。地址可以是类似www.baidu.com这种DNS可解析的名称,或是192.168.1.1这类IPv4地址名,还可以是[0:0:0:0:0:0:0:1]这样用方括号括起来的IPv6地址名。

服务器端口号
指定服务器连接的网络端口号。此项为可选项,若用户省略则自动使用默认端口号。

带层次的文件路径
指定服务器上的文件路径来定位特指的资源。这与UNIX系统的文件目录结构相似。

查询字符串
针对已指定的文件路径内的资源,可以使用查询字符串传入任意参数。此项可选。

片段标识符
使用片段标识符通常可标记出已获取资源中的子资源(文档内的某个位置)。但在RFC中并没有明确规定其使用方法。该项也为可选项。

总的来说URI、URL、URN这三者的关系如图所示:
URI和URL、URN的作用和区别_第4张图片

你可能感兴趣的:(计算机网络)