Sponsor 「QCon全球软件开发大会·上海站」: 硅谷人工智能最近有什么新动态?Google Brain团队工程师周玥枫想跟你分享一些关于 Tensorflow 和深度学习很酷的新进展,2017.10.17-19,QCon上海2017.

备份与归档互联网信息

2016/08/07 · 第662期 · 刷出好文章
原链:www.nytimes.com · 4分钟读完

未来研究我们这个时代历史的人必然要用到现在互联网上的信息。为了方便后人,现在我们需要把互联网上的哪些信息存下来?网站域名会过期、链接会失效、帖子会被删除,保存些什么、该怎么保存?

Internet Archive 的 Wayback Machine 保存了很多网页不同时期的样貌,但网站的 robots.txt 可以阻止他们爬虫的访问;互联网上大部分的信息是搜索引擎爬虫无法触及的。btw,Internet Archive 在旧金山的办公室附近有一家不错的麻辣香锅:)

浏览量:2171
Tags: idea · internet · trend
猜你喜欢:

我读过的好书、 用过的好工具推荐:
Sponsor