学习心得 · 2009年2月8日 0

查看网页的历史页面

大家都知道搜狗有一个网页的历史快照功能,却可能不知道有这么两个网站,它们也可以查询某个网页的历史页面,堪称网页博物馆

第一个是Internet Archive,根据该网站提供的数据,它的Way Back Machine数据库里已经收录了550亿张网页,而且这个数字还在不断地增加。其数据库之大,令人惊叹。查询的时候,只需要在Way Back Machine那里输入URL,点击一下“Take Me Back”按钮,即可查看到该地址的历史网页记录,最早可以查看到1996年的网页存档。

  
第二个就是中国Web信息博物馆,主要存储中文网页。它是在国家 973和985项目支持下,由北京大学网络实验室开发建设的中国网页历史信息存储与展示系统,其工作的基础便是大家所熟知的天网了。根据网站上的介绍,目前其数据库里已经保存有10亿张以网页,并以平均每月一千万网页的速度增加,而网页的历史页面最早可以追朔到2001年。根据网站的知名度,中国Web信息博物馆收录历史页面的频率也不一样。对于一些大站(比如搜狐、网易等),它几乎每天都会留一份历史存档。