没有他的发明,我们连嘲笑微软 IE 浏览器的机会都没有;没有他的发明,Google、Amazon、百度、阿里巴巴都不会存在;没有他的发明,你苹果手机上的 Siri 可能比现在还要蠢。
他是提姆·柏纳-李(Tim Berners-Lee),一位英国计算机科学家,他的发明叫全球资讯网(World Wid Web)。
柏纳-李不是一个「贾伯斯」般如雷贯耳的名字,但关于他的经歷却可写成句句超吸睛的标题:
「网际网路之父」本可碾压比尔盖兹成为世界首富,但他竟没有为发明申请专利!
假如申请发明专利,世界首富不是盖兹而是他!
如果他愿意,二十年前就能成为世界首富!
这个就是本文的主人公:柏纳-李
事实上,没有人是真正的「网际网路之父」,因为网际网路并不是一个单独的发明,说柏纳-李是「全球资讯网之父」比较准确。柏纳-李没有申请专利,不是因为他没有意识到这个发明的价值,而是出于推广全球资讯网的考虑。
网际网路跟全球资讯网不同在哪里?
很多人分不清网际网路(Internet)和全球资讯网(World Wid Web)的区别,简单理解网际网路就是一个全球性的网路,而全球资讯网是我们使用网际网路最常用的入口。做一个不太恰当但容易理解的比喻吧:
如果把网际网路当成围城里的宝石,想要拥有它必须从城墙门口进入。你有很多个门可以选择:HTTP 之门、FTP 之门、SMTP 之门…… 你不用弄懂这些神符一样的英文代表了什么, 只需要知道代表了全球资讯网的「HTTP 之门」,是门槛最低的那道门,而这道门的钥匙就是浏览器。
原来我的灵魂画风……
在全球资讯网没有被发明前,网际网路已经存在了很多年,但上网并不是一件轻松愉快的事。那时人们通过拨打服务器号码上网,入口不是浏览器,没有网页、没有图片、更没有视频,只有像下面这样的一行行文字信息。
毫无疑问,全球资讯网是柏纳-李最重要的发明,但他这一辈子做的事情还有很多,比如成立全球资讯网联盟、提出语义网、唿吁数据公开、成立社交互联数据平台,但都 紧紧围绕同一个主题:打破「信息、数据之墙」,促进开放互联 。
超文字 Hyper Text 就是全球资讯网的原型之一
柏纳-李从小是一个电脑迷。他父母都曾经参与了世界上第一台商业电脑「曼彻斯特·马克一号」(Manchester Makr I)的设计研发,这让他从小就对电脑知识耳濡目染。
1973 — 1976 年,他在牛津大学女王学院学习物理专业。大学期间,由于违反规定被禁止使用学校的电脑,他自己动手用一台电视、一个摩托罗拉旧的微处理器(Motorola 6800)、一根焊接棒,组出了一台电脑。
1976 年大学毕业后,柏纳-李在不同公司担任工程师,但每一份工作都持续不了很长时间。1980 年 6 月-12 月,柏纳-李以咨询顾问的身份,为 欧洲核子研究中心 从事软件工程方面的工作。欧洲核子研究中心是物理界一个着名的研究所,也是发现「上帝粒子」(希格斯粒子)的地方。
1980 年的欧洲核子研究中心,是一个讯息需要高频交换、但又充满了各种「讯息围墙」的地方:一万人在这里来来往往,其中只有 3,000 名左右是这间研究所的员工,其余都是来自世界各地的研究院。他们用着不同的电脑、不同的网路、不同的数据格式、不同的文件系统。
作为一个软体工程师,柏纳-李需要帮助这些研究人员连接上不同的电脑,运行不同的软体城市,在不同格式的文件中找到有联繫的信息,这个过程「让人充满了挫败感」。
为了改变这种局面,柏纳-李打造了一个 基于超文本的索引系统 Enquire,可以帮研究人员在不同的电脑中迅速找到信息,尽管它还只是一个单机程式、有很大的局限性。
Enquire 的底层技术「超文字」,最早于 1963 年被提出,于 1976 年被发明出来投入使用。超文字如今在网际网路上随处可见,我们可以为文字加上链接,点击后便可跳转到相应的网页、文件或文档的某一处。某种意义上,基于超文字的 Enquire 就是全球资讯网的原型。
柏纳-李很快又离开了欧洲核子研究中心,加入了一家电脑公司,参与远程网路唿叫设计,因而获得了网路设计经验。1984 年,他以研究员的身份重返欧洲核子研究中心工作。
HTML、HTTP、URL 的诞生
回到欧洲核子研究中心的柏纳-李,已经具备了开发全球资讯网的条件:超文字和网路设计经验、超强的动手能力、开放的思维方式,再加上欧洲核子原子中心这样一个天然的实验场。
外部环境也已经成熟:TCP/IP 协议、域名系统等底层技术逐渐完善,降低普通人上网门槛的需求也越来越强烈。
1989 年 3 月,柏纳-李萌生了将超文字系统和网路结合在一起、创造一个全球性超文字链接网路的想法:
全球资讯网需要的技术,例如超文字系统、因特网和多种字体的文字文件,都已经被设计出来了。我只需要把他们结合在一起…… 把现在的文件系统都想象成大型虚拟文件系统的一部分。
柏纳-李撰写了一个 提案 交给自己的主管迈克·森道尔(Mike Sendall),后者当时并没有非常感兴趣,只在提案的封面上写下一栏简短的评语:不太明确,但令人激动……(Vague, but exciting…)。18 个月后,迈克才允许柏纳-李兼职实现这个提案,但只是抱着试试看的心态。
柏纳?李提案的封面,右上角写有当时主管的评价
柏纳-李很快开始动手写程式,到 1990 年圣诞,他基本上定义了 Web 的基本概念:HTTP(超文本传输协议)、HTML(超文本标记语言)、URL(统一资源定位符)。你不用瞭解这三个名词的技术实现,只需要知道:
HTTP 超文本传输协议:负责传输信息
HTML 超文本标记语言:负责在网页上显示信息
URL 统一资源定位符:负责给每一个网页一个地址,方便你找到它
这三样东西结合起来,塑造了我们今天习以为常的上网方式:在地址栏输入网页的地址,便能跳转到相应的网页;如果该文档上有超连结,还能点击它进行跳转。相互关联的信息通过「点击-跳转」联繫了起来。
创造了世上第一个网页,柏纳-李为什么不为全球资讯网申请专利?
1991 年 8 月,柏纳-李将他发明的第一个网页浏览器开放给了公众,并且上线了世界上第一个网页:http://info.cern.ch/。
这个网页非常简单,抬头三个大字:World Wide Web。正文介绍了全球资讯网是什么、所用的技术、参与项目的人、项目的歷史等。
世界上第一个网页
值得一提的是,全球资讯网项目参与者中,有一位名为罗伯特·卡里奥(Robert Cailliau)的信息工程师,他长期使用着 Hypercard,这是一个苹果 1987 年发佈、2004 年关停的超问字系统,通过卡里奥间接影响了全球资讯网的设计。全球资讯网 发明出来后,柏纳-李并没有申请专利,因为他自己清楚得很,「开放」是全球资讯网普及的前提,「你不能计划着做一个宇宙一样大的空间,同时保持控制」。
苹果电脑以前的超文本系统 Hypercard
全球资讯网开放给公众的 1991 年,同时诞生的还有明尼苏达大学的 Gopher。Gopher 在后来和全球资讯网的竞争中落败,部分原因就是收费策略。
事实上,柏纳-李确实曾经考虑过为自己的发明申请专利,但不是全球资讯网而是浏览器。最后,他还是因为自己「开放互联」的价值观放弃了这个做法。
全球资讯网开始流行,柏纳-李也在 2017 年荣获图灵奖
诞生头两年,全球资讯网其实并没有多少人用。不管柏纳-李怎么努力推广,每天只有 10-100 次点击率,就连技术社区也不接纳全球资讯网。
他将全球资讯网相关论文提交给了一个超文本社区 Hypertext’91,但被拒绝了。全球资讯网在他们看来太简单了,并且违背了社区规则。
当时,超文字社区的信仰是,连结不应该指向不存在或已删除的文件,因此当时其他一些超文本系统都被约束在一个单独、孤立的数据库里。
而全球资讯网是一个全球性的开放系统,如果某个服务器坏了或某个文档(网页)被删除了,连结就坏了。全球资讯网的开放性在超文字社区看来,反而成了对信仰的亵渎。
改变出现在 1993 年,这一年 Mosaic 浏览器面世。Mosaic 浏览器是第一个可以在文字中插入图片,而不是在单独网页中显示图片的浏览器。它支持全球资讯网、Gopher 等多个网路标准,并且拥有友好的用户界面、简易的安装步骤、可靠的性能。
Mosaic 浏览器
Mosaic 浏览器发佈之时,市面上有好几个竞争者如 Erwise、ViolaWWW、MidasWWW 和 tkWWW,但种种特性使它脱颖而出、大受欢迎,并带动了全球资讯网的流行,「几百万人突然发现全球资讯网可能比×××还要棒」。
全球资讯网真正使得网际网路由少数精英使用的信息传输渠道,变成了供全世界共用的信息共享平台。1993 年后,越来越多的公司开始在全球资讯网的基础上提供服务、做生意,全球资讯网重塑世界经济的故事不必再述。
全球资讯网影响力逐步加大的同时,柏纳-李也获得了相应的肯定:2004 年获得大英帝国爵级司令勋章、2017 年获得电脑科学领域的最负盛名的奖项——图灵奖。
对于任何一个人来说,取得如此成就已经可以躺在功劳簿上睡大觉,但柏纳-李真是闲不下来,他对网际网路的贡献远不止全球资讯网这个发明。
人工智慧、Google、Siri 都要归功于柏纳-李的构思
在柏纳-李 1989 年的提案中,全球资讯网「不仅是一个文本文档的网际网路,也是一个知识的网际网路」。
全球资讯网首先通过超文本链接实现了文档(网页)的互联,到 1998 年,柏纳-李正式将「知识网际网路」的构想命名为语义网(Semantic Web),并将自己的工作重心放在推广语义网上。
语义网是全球资讯网的变革和延伸,它的目的是让电脑也能像人类一样瞭解网页上的内容。
比如,人们看到网页上的天气预报,会知道哪个数字是温度,哪个是湿度。语义网的目的就要通过隐藏的编码,告诉电脑哪个数字代表温度,哪个数字代表湿度,并且说明「温度」和「湿度」的含义。
2006 年,语义网发展到了一个瓶颈,需要大量结构化的公开数据,柏纳-李提出了互联数据(Linked Data)的概念,还在 2009 年的 TED 大会上 唿吁政府和机构公开原始数据 (Raw Data)。同年,白宫成立了一个网站 Data.gov,要求所有的部门都要有公开数据。
大量数据公开后,有机构把它们进行了结构化,这些结构化的互联数据库默默影响着人工智慧的发展。
2011 年,IBM 的人工智慧华生(Watson) 在美国电视智力竞赛节目《危险边缘》(Jeopardy!)中击败人类选手,获得百万美元大奖,就是採用了 DBpedia(维基百科的结构化数据库)、YAGO(集成 Wikipedia、WordNet 和 GeoNames 三个来源的数据库)等成果。
2012 年,Google 收购了一家做结构化数据的公司 Metaweb,在后者数据库 Freebase 的基础上发起了知识图谱(Knowledge Graph)项目。苹果的 Siri,也是脱胎于一个基于语义网的项目 CALO(Cognitive Assistant that Learns and Organizes)。
右侧红框圈起来的就是语义网的应用
一个账号登上所有应用、不怕应用倒闭的新平台
尽管柏纳-李一直推动网路往开放互联的方向发展,但「数据围墙」的现象还是以另一种形式重现了:科技公司借助免费服务将用户控制在自己的应用内,用户的数据分散在各个平台,更无力保护自己的隐私。
矛盾在最近几年集中爆发了,标志性事件莫过于今年 Facebook 被曝出 2016 年时保护隐私不力,让剑桥分析公司得以未经授权访问 5000 万用户数据。社会开始出现一股批评科技公司、将数据还给用户的思潮。
在这样的时间节点,柏纳-李的新项目恰逢其时。2018 年 9 月 29 日,他发佈了一篇名为 《互联网的一小步……》 的文章,对外宣佈成立一家基于 Solid 平台 的初创公司 Inrupt。
2015 年,柏纳-李就在麻省理工啓动了 Solid 项目。Solid 全称社交互联数据(Social Linked Data),是一个去中心化的社交平台,基于 2006 年提出的互联数据(Linked Data)的技术和规范。
现在我们使用社交平台的现状是,微信有个账号、QQ 有个账号、微博有个账号,此外还有 Twitter、Facebook 等。每个账号的数据都独立保存在运营方自己的服务器里,互不打通。
这样有两个显而易见的弊端:
1. 用户数据掌握在运营方手里,有被滥用的可能
2. 如果运营方经营不善或者关停服务,那用户在这个社交平台的数据也将付诸东流。
Path 和 Google+ 关闭 ,就是最好的例子。
Solid 的解决方案把用户数据和应用分离开了,让用户把自己的数据都集中在一起,称之为「个人在线数据」(Personal Online Data,简称 POD)。然后,将 POD 储存在自己建的服务器,或者受信任的个人在线数据商(Personal Online Data Stores,简称 PODS)。
用户会有一个 WebID, 可以登陆所有基于 Solid 平台的应用,用户能自己控制给哪个应用多少信息。
目前,Solid 平台还处于原型阶段,主要面向开发者。柏纳-李用 Solid 平台的技术打造了一款自己使用的应用, 国外一家媒体看过后评价道 :
这款应用程式,使用了 Solid 的去中心化技术,允许柏纳-李无缝访问他的所有数据——他的日历、音乐库、视频、聊天记录、研究。它就像 Google Drive,Microsoft Outlook,Slack,Spotify 和 WhatsApp 的混合体。
至于 Inrupt,是帮助 Solid 平台成长的一个初创公司。Inrupt 之于 Solid,好比 Mosaic 浏览器之于全球资讯网,是一个领路人的角色。柏纳-李希望 Inrupt 能够为 Solid 带来一个「生态系统」,其中的市场机会包括 Solid APP 和 Solid 数据存储等。
柏纳-李本人已经向麻省理工学院请了长假,专心在开发者群体中推广 Solid 和 Inrupt。这是他又一次转变工作重心。过去,柏纳-李一直在致力于通过全球资讯网、语义网互联公开信息,现在他尝试通过 Solid 来互联个人信息、解决科技大公司垄断用户数据的问题。
这必定不是一个短期内可以看到成效的项目:社交巨头和网际网路公司不会将用户账号数据拱手相让,让用户个体自发迁移也需要极大的教育成本。但正如全球资讯网刚诞生时缺少关注,谁也不知道 Solid 会不会成为下一颗参天大树。