UFO中文网

 找回密码
 注册会员
查看: 291|回复: 20
收起左侧

互联网的博物馆

[复制链接]
online_member 发表于 2022-12-16 10:19:20 | 显示全部楼层 |阅读模式
本文原创自公众号「挖互联网」
我会不定期更新发现互联网上有趣有用的东西。

都说互联网是有记忆的,弥补人类记忆的短暂。
你有没有想过,很多年前你曾浏览过的网站或某个网页,如今,即使那个网站已经倒闭,页面已经删除,或者,你访问某个网页,页面上显示一个大大的404 --- 因为某种原因页面已经被管理员删除了。
现在,凭着你的记忆,你还可以将它回来,继续浏览。

就是互联网存档计划,今天要跟大家分享的几个网站,他们做着这样的一件事:将互联网上出现过的网页,永远保存下来,让你任何时候都可以浏览。
被叫作"互联网档案计划"(Internet Archive)。

archive.org 就是这样的一家机构,靠捐款在运营的一家公益组织。
他们在首页上这样介绍自己:
Internet Archive is a non-profit library of millions of free books, movies, software, music, websites, and more.
Internet档案馆是一个非营利性图书馆,包含数百万本免费书籍,电影,软件,音乐,网站等。

互联网的博物馆-1.jpg

创始人 Brewster Kahle

保存网站只是他们是他们的功能的一部分。 你可以上找面找到无数在中文互联网上已经失传的书籍,短片 ,论文资料。甚至应用程序(我曾通过它下载过98年版本的QQ)

互联网的博物馆-2.jpg
这个服务,很酷的是,到目前为止,它已经保存了5140亿个网页(截止2021年1月)
它最早从1996开始存档(1996年前很多有意义的网站人类永远都看不到了)也就是说,你可以很简单地通过输入网址查看90年代的一些网站的样子。 比如1996年的yahoo,  当时的google。中文网站也不例外,比如,你可以看看2000年的新浪。
https://web.archive.org/web/20000510183111/http://home.sina.com/index.html

互联网的博物馆-3.jpg

互联网的博物馆-4.jpg
这家位于美国的机构,20多年来,一直坚持到如今,需要的带宽和存储开支可想而知。全靠一些企业捐助,不过早在几年前就爆出开支不足,所以他们在页面上建议(非强制)你捐出任意金额美元以资助他们继续进行项目。同时,有一位慷慨的神秘人士愿意以网友捐出的数额2倍金额认捐,也就是说,你捐赠10美元,神秘人即会捐出20美元。
如果你查询一些重要的文献资料,或作一些调查,这个网站应该会对你有用。上有很大量书籍和文献,音视频资料。将是一个取之不尽的宝库。
对了,它需要梯子。
另外,假如你想让某个网页永远保存下来,你也可以提交给它,虽然它本来也会自动抓取。
它也有chrome插件,方便提查看或提交。

除了这个家以外,也有别的网站做类似的事。
比如archive.is:
它与前者不同的是,为了保证准确性,它会保存一份文字版本和一份截图版本。
而且,它不遵循Robots协议,也就是搜索引擎没有检索的网页它依然会保存,甚至会缓存动态网页。和前者一样,你也可以主动提交。
这些都是国外的网站。其实,中文界早有人想做类似的事。早前看到北京一些机构在做。可惜现在都不能访问了,似乎项目已经中止。
希望对你有用。
online_member 发表于 2022-12-16 10:19:37 | 显示全部楼层
想知道中国有哪些机构在做
online_member 发表于 2022-12-16 10:20:11 | 显示全部楼层
目前好像都没有啦
online_member 发表于 2022-12-16 10:21:08 | 显示全部楼层
被和谐掉的网站的备份也要删除吗
online_member 发表于 2022-12-16 10:22:08 | 显示全部楼层
会保留
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

UFO中文网

GMT+8, 2024-11-25 01:05

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表