他山之石 | 互联网档案馆

互联网档案馆(The Internet Archive),自1996年成立起,The Internet Archive定期收录并永久保存全球网站上可以抓取的信息。

简介

由 Alexa 创始人Brewster Kahle创办,是一个Wayback machine公益性质的计划。Internet Archive 非正式中文名有“网站时光倒流机器”“互联网档案馆”等。对于不同的网站,其收录的网页数量和收集周期也不相同,一些大型网站可能每天都会被“备份”一次,每次可能收录数十个以上的网页,而一些小型网站可能每年收录几次,每次只有几个网页。对网站不同时期的历史资料进行研究,是互联网档案馆最大的价值所在。用户可以通过 Internet Archive 的“Take Me Back”对网站的发展与历史资料进行研究。

互联网档案计划

“互联网档案计划”分为六大部分:

一、电子书

这个部分,我以前已经介绍过了,它专门收集公共领域的书籍和文档,任何人都可以免费下载。截至到今天,共有29万多种材料,堪称互联网上最好的公共领域图书搜索引擎。

它主要收集英语书籍,但也包括少部分其他语种的书籍,比如朱熹的《论语集注》。

二、网页

他山之石 | 互联网档案馆_第1张图片

光倒流机器”截图 2012.08

这个部分有个专门的名字,叫做”时光倒流机器“(Wayback Machine),它像收集旧报纸那样收集旧网页。举例来说,Yahoo!的首页就有5000多份档案,最早的可以回溯到1996年10月17日,最近的则是2007年8月30日。

要将全世界的网页都保存下来,需要多大的存储容量?根据2006年的统计,当时Wayback Machine的存储容量有2000T,然后还在以每月20T的速度增加。

三、视频

这个部分收集视频材料,你在其中可以找到动画片和电影。

四、音频

音频材料主要是有声书籍和音乐。

五、软件

六、教育材料

这部分主要是美国大学课程,有视频和文字材料下载,相当于不去北美就可以上那里的课,比如麻省理工学院的《微分方程》和Naropa大学的《艾伦·金斯堡的诗歌》。


本文为转载自微信公众号“档案管理与利用”,欢迎分享至朋友圈,转载及合作事宜请通过后台留言或电话、邮件等方式联系枣庄市档案局(馆)。

联系我们

拨打电话0632-3315774或发送邮件至[email protected]

他山之石 | 互联网档案馆_第2张图片

你可能感兴趣的:(他山之石 | 互联网档案馆)