Последнее время необходимость восстановления удаленной из интернетов информации возникает все чаще. Традиционно используемые для этой цели кэши поисковиков имеют один существенный недостаток - они иногда обновляются до текущей (т.е., удаленной) версии и не предусматривают хранение нескольких копий страницы за разные даты.
Сам я довольно часто использую архивы интернета не только для доступа к удаленной информации, но и для сравнения версий существующей информации, а также в качестве сервиса сохранения информации в публичном доступе, если есть риск её уничтожения в результате вандализма, психопатии или деструктивной активности государственных институтов.
Ниже представлен список общедоступных и достаточно мощных инструментов для решения этих задач. Их не стоит путать с электронными библиотеками, включая оцифрованные бумажные архивы, базами данных и тому подобным. Надеюсь, он окажется вам полезен.
1. http://archive.org/web/. Архив интернетов. В представлении, кмк, не нуждается. Изнутри чебурашки работает нестабильно. Не обрабатывает страницы, запрещенные к индексации.
2. http://archive.is/. Самый удобный инструмент для изготовления собственных снапшотов. Кроме прочего, содержит большой архив русскоязычного ЖЖ.
3. http://www.webcitation.org/. Веб-цитатник. Любим википедистами. В основном архив научных статей и инструмент для создания библиографических ссылок правильного формата.
4. http://www.webarchive.org.uk/ukwa/. Проект Британской библиотеки в сотрудничестве с рядом британских организаций и университетов. Британский сегмент интернета с тематическим каталогом.
5. https://swap.stanford.edu/. Коллекция вебсайтов Стэ́нфордского университе́та.
6. http://www.bibalex.org/isis/frontend/archive/archive_web.aspx. Один из самых старых, наряду с №1, архивов от Новой Александрийской библиотеки (в Египте), но уступающий конечно по количеству контента. Также коллекция медийных материалов.
7. http://loc.gov/websites/. Архив сайтов от Библиотеки конгресса США. Ничего не могу сказать, не было случая использовать.

8. https://archive-it.org/. По сути это дочерний проект Архива интернета (№1), в различия не вдавался, но отмечаю, что такой есть.
9. http://vefsafn.is/index.php?page=english. Исландский веб-архив - исландские сайты с 2004 года!
10. http://veebiarhiiv.digar.ee/. Эстонский архив на эстонском языке. Возможно, пригодится моим лингвистическим френдам
11. http://www.zal-lj.si/. Тоже на словенском! По Словении.
12. http://www.webharvest.gov/. Архив государственных сайтов США с 2001 года от Национального архивного управления. Специальный архив для профильных специалистов.
13. http://webarchive.parliament.uk/. Архив от парламента Великобритании для пользования парламентариями. Но общедоступен. Кроме поиска по URL есть поиск по keywords.
14. http://webarchive.proni.gov.uk/. Раздел этого же архива по Северной Ирландии.
20-00.livejournal.com/104984.html#comments
Сам я довольно часто использую архивы интернета не только для доступа к удаленной информации, но и для сравнения версий существующей информации, а также в качестве сервиса сохранения информации в публичном доступе, если есть риск её уничтожения в результате вандализма, психопатии или деструктивной активности государственных институтов.
Ниже представлен список общедоступных и достаточно мощных инструментов для решения этих задач. Их не стоит путать с электронными библиотеками, включая оцифрованные бумажные архивы, базами данных и тому подобным. Надеюсь, он окажется вам полезен.
1. http://archive.org/web/. Архив интернетов. В представлении, кмк, не нуждается. Изнутри чебурашки работает нестабильно. Не обрабатывает страницы, запрещенные к индексации.
2. http://archive.is/. Самый удобный инструмент для изготовления собственных снапшотов. Кроме прочего, содержит большой архив русскоязычного ЖЖ.
3. http://www.webcitation.org/. Веб-цитатник. Любим википедистами. В основном архив научных статей и инструмент для создания библиографических ссылок правильного формата.
4. http://www.webarchive.org.uk/ukwa/. Проект Британской библиотеки в сотрудничестве с рядом британских организаций и университетов. Британский сегмент интернета с тематическим каталогом.
5. https://swap.stanford.edu/. Коллекция вебсайтов Стэ́нфордского университе́та.
6. http://www.bibalex.org/isis/frontend/archive/archive_web.aspx. Один из самых старых, наряду с №1, архивов от Новой Александрийской библиотеки (в Египте), но уступающий конечно по количеству контента. Также коллекция медийных материалов.
7. http://loc.gov/websites/. Архив сайтов от Библиотеки конгресса США. Ничего не могу сказать, не было случая использовать.

8. https://archive-it.org/. По сути это дочерний проект Архива интернета (№1), в различия не вдавался, но отмечаю, что такой есть.
9. http://vefsafn.is/index.php?page=english. Исландский веб-архив - исландские сайты с 2004 года!

10. http://veebiarhiiv.digar.ee/. Эстонский архив на эстонском языке. Возможно, пригодится моим лингвистическим френдам

11. http://www.zal-lj.si/. Тоже на словенском! По Словении.
12. http://www.webharvest.gov/. Архив государственных сайтов США с 2001 года от Национального архивного управления. Специальный архив для профильных специалистов.
13. http://webarchive.parliament.uk/. Архив от парламента Великобритании для пользования парламентариями. Но общедоступен. Кроме поиска по URL есть поиск по keywords.
14. http://webarchive.proni.gov.uk/. Раздел этого же архива по Северной Ирландии.
20-00.livejournal.com/104984.html#comments